Inherent Dynamics Visualizer, eine interaktive Anwendung zur Bewertung und Visualisierung von Ergebnissen aus einer Gene Regulatory Network Inference Pipeline

Robert C. Moseley; Sophia Campione; Bree Cummins; Francis Motta; Steven B. Haase

doi:10.3791/63084

Zum Anzeigen dieser Inhalte ist ein JoVE-Abonnement erforderlich. Melden Sie sich an oder starten Sie Ihre kostenlose Testversion.

Method Article

Inherent Dynamics Visualizer, eine interaktive Anwendung zur Bewertung und Visualisierung von Ergebnissen aus einer Gene Regulatory Network Inference Pipeline

DOI:

10.3791/63084

⸱

December 7th, 2021

Robert C. Moseley¹, Sophia Campione¹, Bree Cummins², Francis Motta³, Steven B. Haase¹

¹Department of Biology, Duke University, ²Department of Mathematical Sciences, Montana State University, ³Department of Mathematical Sciences, Florida Atlantic University

Please note that all translations are automatically generated. Click here for the English version.

Zusammenfassung

Der Inherent Dynamics Visualizer ist ein interaktives Visualisierungspaket, das mit einem Genregulationsnetzwerk-Inferenzwerkzeug verbunden ist, um eine verbesserte, optimierte Generierung funktionaler Netzwerkmodelle zu ermöglichen. Der Visualizer kann verwendet werden, um fundiertere Entscheidungen für die Parametrisierung des Inferenzwerkzeugs zu treffen und so das Vertrauen in die resultierenden Modelle zu erhöhen.

Zusammenfassung

Die Entwicklung von genregulatorischen Netzwerkmodellen ist eine große Herausforderung in der Systembiologie. Mehrere Rechenwerkzeuge und Pipelines wurden entwickelt, um diese Herausforderung zu bewältigen, einschließlich der neu entwickelten Inherent Dynamics Pipeline. Die Inherent Dynamics Pipeline besteht aus mehreren zuvor veröffentlichten Tools, die synergistisch arbeiten und linear miteinander verbunden sind, wobei die Ausgabe eines Tools dann als Eingabe für das folgende Tool verwendet wird. Wie bei den meisten Berechnungstechniken erfordert jeder Schritt der Inherent Dynamics Pipeline, dass der Benutzer Entscheidungen über Parameter trifft, die keine genaue biologische Definition haben. Diese Entscheidungen können sich wesentlich auf die durch die Analyse erzeugten modelle des genregulatorischen Netzwerks auswirken. Aus diesem Grund kann die Fähigkeit, die Konsequenzen verschiedener Parameterauswahlen bei jedem Schritt zu visualisieren und zu untersuchen, dazu beitragen, das Vertrauen in die Entscheidungen und die Ergebnisse zu erhöhen. Der Inherent Dynamics Visualizer ist ein umfassendes Visualisierungspaket, das den Prozess der Bewertung der Parameterauswahl über eine interaktive Schnittstelle in einem Webbrowser rationalisiert. Der Benutzer kann die Ausgabe jedes Schritts der Pipeline separat untersuchen, intuitive Änderungen basierend auf visuellen Informationen vornehmen und von der automatischen Erstellung der erforderlichen Eingabedateien für die Inherent Dynamics Pipeline profitieren. Der Inherent Dynamics Visualizer bietet einen beispiellosen Zugang zu einem hochkomplizierten Werkzeug zur Entdeckung von genregulatorischen Netzwerken aus transkriptomischen Zeitreihendaten.

Einleitung

Viele wichtige biologische Prozesse, wie Zelldifferenzierung und Umweltreaktion, werden von Gensätzen gesteuert, die in einem genregulatorischen Netzwerk (GRN) miteinander interagieren. Diese GRNs erzeugen die Transkriptionsdynamik, die für die Aktivierung und Aufrechterhaltung des von ihnen kontrollierten Phänotyps erforderlich ist, so dass die Identifizierung der Komponenten und der topologischen Struktur der GRN der Schlüssel zum Verständnis vieler biologischer Prozesse und Funktionen ist. Eine GRN kann als eine Reihe von interagierenden Genen und/oder Genprodukten modelliert werden, die durch ein Netzwerk beschrieben werden, dessen Knoten die Gene sind und dessen Kanten die Richtung und Form der Interaktion beschreiben (z. B. Aktivierung/Unterdrückung der Transkription, posttranslationale Modifikation usw.). ¹. Interaktionen können dann als parametrisierte mathematische Modelle ausgedrückt werden, die den Einfluss beschreiben, den ein regulierendes Gen auf die Produktion seiner Ziele ^hat2,3,4. Die Inferenz eines GRN-Modells erfordert sowohl eine Inferenz der Struktur des Interaktionsnetzwerks als auch eine Schätzung der zugrunde liegenden Interaktionsparameter. Es wurde eine Vielzahl von computergestützten Inferenzmethoden entwickelt, die Zeitreihen-Genexpressionsdaten aufnehmen und GRN-Modelle ^ausgeben5. Vor kurzem wurde eine neue GRN-Inferenzmethode namens Inherent Dynamics Pipeline (IDP) entwickelt, die Zeitreihen-Genexpressionsdaten verwendet, um GRN-Modelle mit markierten Regulator-Ziel-Interaktionen zu erzeugen, die in der Lage sind, Dynamiken zu erzeugen, die der beobachteten Dynamik in den Genexpressionsdaten ^entsprechen6. Der IDP ist eine Suite von Werkzeugen, die linear in eine Pipeline eingebunden sind und in drei Schritte unterteilt werden können: ein Node-Finding-Schritt, der Gene basierend auf Genexpressionsmerkmalen einstuft, von denen bekannt ist oder vermutet wird, dass sie mit der Funktion des ^GRN7,8 zusammenhängen, ein Edge Finding-Schritt, der paarweise regulatorische Beziehungen ^bewertet8^,⁹ und ein Netzwerkfindungsschritt, der GRN-Modelle erzeugt, die in der Lage sind, die beobachtete Dynamik ^{zu erzeugen10,11,12,13,14,15}.

Wie die meisten Berechnungsmethoden erfordert der IDP eine Reihe von benutzerdefinierten Argumenten, die bestimmen, wie die Eingabedaten analysiert werden, und verschiedene Satz von Argumenten können unterschiedliche Ergebnisse für dieselben Daten liefern. Beispielsweise enthalten mehrere Methoden, einschließlich des IDP, Argumente, die einen Schwellenwert auf die Daten anwenden, und das Erhöhen/Verringern dieses Schwellenwerts zwischen aufeinanderfolgenden Ausführungen der jeweiligen Methode kann zu unterschiedlichen Ergebnissen zwischen den Durchläufen führen (siehe Ergänzungshinweis 10: Netzwerkinferenzmethoden ^von5). Zu verstehen, wie sich jedes Argument auf die Analyse und die nachfolgenden Ergebnisse auswirken kann, ist wichtig, um ein hohes Vertrauen in die Ergebnisse zu erreichen. Im Gegensatz zu den meisten GRN-Inferenzmethoden besteht der IDP aus mehreren Rechenwerkzeugen, von denen jedes seinen eigenen Satz von Argumenten hat, die ein Benutzer angeben muss, und jedes hat seine eigenen Ergebnisse. Während der IDP eine umfangreiche Dokumentation zur Parametrisierung der einzelnen Werkzeuge bereitstellt, macht die gegenseitige Abhängigkeit jedes Werkzeugs von der Ausgabe des vorherigen Schritts die Parametrierung der gesamten Pipeline ohne Zwischenanalysen zu einer Herausforderung. Beispielsweise basieren Argumente in den Schritten Edge und Network Finding wahrscheinlich auf biologischem Vorwissen und hängen daher vom Datensatz und/oder Organismus ab. Um Zwischenergebnisse abzufragen, wäre ein grundlegendes Verständnis der Programmierung sowie ein tiefes Verständnis aller Ergebnisdateien und ihrer Inhalte aus dem IDP erforderlich.

Der Inherent Dynamics Visualizer (IDV) ist ein interaktives Visualisierungspaket, das im Browserfenster eines Benutzers ausgeführt wird und Benutzern des IDP die Möglichkeit bietet, die Auswirkungen ihrer Argumentauswahl auf die Ergebnisse eines beliebigen Schritts im IDP zu bewerten. Der IDV navigiert durch eine komplizierte Verzeichnisstruktur, die vom IDP erzeugt wird, sammelt die notwendigen Daten für jeden Schritt und präsentiert die Daten in intuitiven und interaktiven Abbildungen und Tabellen, die der Benutzer erkunden kann. Nach dem Erkunden dieser interaktiven Displays kann der Benutzer neue Daten aus einem IDP-Schritt erstellen, die auf fundierteren Entscheidungen basieren können. Diese neuen Daten können dann sofort im nächsten entsprechenden Schritt des IDP verwendet werden. Darüber hinaus kann die Untersuchung der Daten helfen zu bestimmen, ob ein IDP-Schritt mit angepassten Parametern erneut ausgeführt werden sollte. Das IDV kann die Verwendung des IDP verbessern sowie die Verwendung des IDP intuitiver und zugänglicher machen, wie die Untersuchung des Kernoszillators GRN des Hefezellzyklus zeigt. Das folgende Protokoll enthält IDP-Ergebnisse aus einer vollständig parametrisierten IDP-Ausführung im Gegensatz zu einem Ansatz, der den IDV nach Den Ausführungen jedes IDP-Schritts, d. h. Knoten-, Edge- und Netzwerksuche, enthält.

Access restricted. Please log in or start a trial to view this content.

Protokoll

1. Installieren Sie den IDP und IDV

HINWEIS: In diesem Abschnitt wird davon ausgegangen, dass docker, conda, pip und git bereits installiert sind (Tabelle der Materialien).

Geben Sie in einem Terminal den folgenden Befehl ein: git clone https://gitlab.com/biochron/inherent_dynamics_pipeline.git.
Befolgen Sie die Installationsanweisungen in der README-Datei des IDP.
Geben Sie in einem Terminal den Folgenden ein: git clone https://gitlab.com/bertfordley/inherent_dynamics_visualizer.git.
HINWEIS: Das Klonen des IDV sollte außerhalb des Verzeichnisses der obersten Ebene des IDP erfolgen.
Befolgen Sie die Installationsanweisungen in der README-Datei des IDV.

2. Knotenfindung

Erstellen Sie eine neue IDP-Konfigurationsdatei, die den Schritt Knotensuche parametrisiert.
HINWEIS: Alle Anführungszeichen in den folgenden Schritten sollten nicht eingegeben werden. Die Anführungszeichen werden hier nur als Trennzeichen zwischen dem Protokolltext und dem, was abgetippt werden soll, verwendet.
1. Fügen Sie der Konfigurationsdatei die wichtigsten IDP-Argumente hinzu.
2. Öffnen Sie eine neue Textdatei in einem Texteditor und geben Sie in einzelnen Zeilen "data_file =", "annotation_file =", "output_dir =", "num_proc =" und "IDVconnection = True" ein.
3. Geben Sie für "data_file" nach dem Gleichheitszeichen den Pfad zu und den Namen der jeweiligen Zeitreihendatei ein und geben Sie ein Komma nach dem Namen ein. Trennen Sie jede Daten durch ein Komma, wenn mehr als ein Zeitreihendatensatz verwendet wird. Ein Beispiel für Zeitreihen-Genexpressionsdateien finden Sie unter Supplemental File 1 und Supplemental File 2 .
4. Geben Sie nach dem Gleichheitszeichen den Pfad zu und den Namen der Anmerkungsdatei für "annotation_file" ein. Ein Beispiel für eine Anmerkungsdatei finden Sie unter Ergänzungsdatei 3 .
5. Geben Sie für "output_file" nach dem Gleichheitszeichen den Pfad und den Namen des Ordners ein, in dem die Ergebnisse gespeichert werden.
6. Geben Sie nach dem Gleichheitszeichen für "num_proc" die Anzahl der Prozesse ein, die der IDP verwenden soll.
7. Fügen Sie der Konfigurationsdatei Node Finding-Argumente hinzu.
8. Geben Sie in derselben Textdatei wie in Schritt 2.1.1 in der angegebenen Reihenfolge "[dlxjtk_arguments]", "periods =" und "dlxjtk_cutoff =" in einzelnen Zeilen ein. Platzieren Sie diese nach den Hauptargumenten.
9. Wenn für "Perioden" nach dem Gleichheitszeichen einzugeben, wenn ein einmaliger Reihendatensatz verwendet wird, geben Sie jede Periodenlänge durch Kommas getrennt ein. Geben Sie für mehr als einen Zeitreihendatensatz jeden Satz von Periodenlängen wie zuvor ein, setzen Sie jedoch eckige Klammern um jeden Satz und setzen Sie ein Komma zwischen die Mengen.
10. Geben Sie nach dem Gleichheitszeichen für "dlxjtk_cutoff" eine ganze Zahl ein, die die maximale Anzahl von Genen angibt, die in der gene_list_file von de Lichtenberg durch JTK_CYCLE (DLxJTK) (Tabelle 1) beibehalten werden sollen.
  HINWEIS: Es wird dringend empfohlen, die dlxjtk_arguments Abschnitte in der IDP-README-Datei zu lesen, um ein besseres Verständnis der einzelnen Argumente zu erhalten. Ein Beispiel für eine Konfigurationsdatei mit den angegebenen Node Finding-Argumenten finden Sie unter Ergänzungsdatei 4 .
Wechseln Sie im Terminal in das IDP-Verzeichnis mit dem Namen inherent_dynamics_pipeline.
Geben Sie im Terminal den Folgenden ein: conda activate dat2net
Führen Sie den IDP mit der in Schritt 2.1 erstellten Konfigurationsdatei aus, indem Sie diesen Befehl im Terminal ausführen, wobei der Name der Datei ist: python src/dat2net.py
Wechseln Sie im Terminal in das Verzeichnis mit dem Namen inherent_dynamics_visualizer und geben Sie den folgenden Befehl ein: . /viz_results.sh
HINWEIS: verweist auf das Verzeichnis, das als Ausgabeverzeichnis für den IDP verwendet wird.
Geben Sie in einem Webbrowser http://localhost:8050/ als URL ein.
Wenn der IDV nun im Browser geöffnet ist, klicken Sie auf die Registerkarte Node Finding und wählen Sie den gewünschten Node-Suchordner aus dem Dropdown-Menü aus.
Kuratieren Sie manuell eine neue Genliste aus der Genlistentabelle im IDV, die für nachfolgende IDP-Schritte verwendet werden soll.
1. Um die Genlistentabelle zu erweitern oder zu kürzen, klicken Sie auf die Pfeile nach oben oder unten oder geben Sie manuell eine ganze Zahl zwischen 1 und 50 in das Feld neben Genexpression von DLxJTK-gene ein. Oben:.
2. Klicken Sie in der Genlistentabelle auf das Kästchen neben einem Gen, um sein Genexpressionsprofil in einem Liniendiagramm anzuzeigen. Mehrere Gene können hinzugefügt werden.
3. Geben Sie optional die Anzahl der gleich großen Behälter an, um Gene nach dem Zeitintervall zu berechnen und zu ordnen, das ihre Peakexpression enthält, indem Sie eine ganzzahlige Zahl in das Eingabefeld über der Genlistentabelle mit der Bezeichnung Input integer eingeben, um den ersten Zyklus in Behälter zu unterteilen:.
  HINWEIS: Diese Option ist spezifisch für die Schwingungsdynamik und möglicherweise nicht auf andere Arten von Dynamik anwendbar.
4. Wählen Sie eine Heatmap-Anzeigeeinstellung aus, indem Sie auf eine Option unter Gene bestellen nach: Erster Zyklus Max Expression (Tabelle 1) klicken, die Gene basierend auf dem Zeitpunkt des Genexpressionspeaks im ersten Zyklus ordnet.
  HINWEIS: DLxJTK Rank ordnet Gene basierend auf dem Periodizitätsranking aus dem DLxJTK-Algorithmus des IDP.
5. Klicken Sie auf die Schaltfläche Genliste herunterladen , um die Genliste in das Dateiformat herunterzuladen, das für den Schritt Edge Finding benötigt wird. Ein Beispiel für eine Genlistendatei finden Sie unter Ergänzungsdatei 5 .
Kennzeichnen Sie in der Bearbeitbaren Genanmerkungstabelle ein Gen als Ziel, Regulator oder beides in der Anmerkungsdatei für den Schritt Edge Finding in einem neuen Edge Finding-Lauf. Wenn ein Gen ein Regulator ist, markieren Sie das Gen als Aktivator, Repressor oder beides.
1. Um ein Gen als Aktivator zu kennzeichnen, klicken Sie auf die Zelle in der Spalte tf_act und ändern Sie den Wert auf 1. Um ein Gen als Repressor zu kennzeichnen, ändern Sie den Wert in der Spalte tf_rep in 1. Ein Gen kann sowohl als Aktivator als auch als Repressor im Schritt Edge Finding fungieren, indem die Werte in den Spalten tf_act und tf_rep auf 1 gesetzt werden.
2. Um ein Gen als Ziel zu kennzeichnen, klicken Sie auf die Zelle in der Zielspalte und ändern Sie den Wert auf 1.
Klicken Sie auf die Schaltfläche Anmerkung herunterladen, um die Anmerkungsdatei in das Für den Schritt Edge Finding benötigte Dateiformat herunterzuladen.

3. Edge-Suche

Erstellen Sie eine neue IDP-Konfigurationsdatei, die den Schritt Edgesuche parametrisiert.
1. Fügen Sie der Konfigurationsdatei die wichtigsten IDP-Argumente hinzu. Öffnen Sie eine neue Textdatei in einem Texteditor und wiederholen Sie Schritt 2.1.1.
2. Fügen Sie der Konfigurationsdatei Edge-Suchargumente hinzu.
3. Geben Sie in derselben Textdatei wie in Schritt 3.1.1 in der angegebenen Reihenfolge "[lempy_arguments]", "gene_list_file =", "[netgen_arguments]", "edge_score_column =", "edge_score_thresho =", "num_edges_for_list =", "seed_threshold =" und "num_edges_for_seed =" in einzelnen Zeilen ein. Diese sollten unter die Hauptargumente gehen.
4. Geben Sie für "gene_list_file" nach dem Gleichheitszeichen den Pfad und den Namen der in Schritt 2.8.5 generierten Genlistendatei ein.
5. Geben Sie für "edge_score_column" nach dem Gleichheitszeichen entweder "pld" oder "norm_loss" ein, um anzugeben, welche Datenrahmenspalte aus der Lempy-Ausgabe zum Filtern der Kanten verwendet wird.
6. Wählen Sie entweder "edge_score_threshold" oder "num_edges_for_list" und löschen Sie das andere. Wenn "edge_score_threshold" ausgewählt wurde, geben Sie eine Zahl zwischen 0 und 1 ein. Diese Nummer wird verwendet, um Kanten basierend auf der in Schritt 3.1.5 angegebenen Spalte zu filtern.
  1. Wenn "num_edges_for_list" ausgewählt wurde, geben Sie einen Wert ein, der gleich oder kleiner als die Anzahl der möglichen Kanten ist. Diese Nummer wird verwendet, um die Kanten basierend auf ihrer Rangfolge in der in Schritt 3.1.5 angegebenen Spalte zu filtern. Die verbleibenden Kanten werden verwendet, um Netzwerke in der Netzwerksuche aufzubauen.
7. Wählen Sie entweder "seed_threshold" oder "num_edges_for_seed" und löschen Sie das andere. Wenn "seed_threshold" ausgewählt wurde, geben Sie eine Zahl zwischen 0 und 1 ein. Diese Nummer wird verwendet, um Kanten basierend auf der in Schritt 3.1.5 angegebenen Spalte zu filtern.
  1. Wenn "num_edges_for_seed" ausgewählt wurde, geben Sie einen Wert ein, der gleich oder kleiner als die Anzahl der möglichen Kanten ist. Diese Nummer wird verwendet, um die Kanten basierend auf ihrer Rangfolge in der in Schritt 3.1.5 angegebenen Spalte zu filtern. Die verbleibenden Kanten werden zum Erstellen des Seed-Netzwerks (Tabelle 1) verwendet, das in der Netzwerksuche verwendet wird.
    HINWEIS: Es wird dringend empfohlen, die Abschnitte lempy_arguments und netgen_arguments in der IDP-README-Datei zu lesen, um ein besseres Verständnis der einzelnen Argumente zu erhalten. Ein Beispiel für eine Konfigurationsdatei mit den angegebenen Edge-Suchargumenten finden Sie unter Ergänzungsdatei 7 .
Wiederholen Sie die Schritte 2.2 und 2.3.
Führen Sie den IDP mit der in Schritt 3.1 erstellten Konfigurationsdatei aus, indem Sie diesen Befehl im Terminal ausführen, wobei der Name der Datei ist: python src/dat2net.py
Wenn der IDV noch läuft, stoppen Sie ihn, indem Sie im Terminalfenster Control C drücken, um das Programm zu stoppen. Wiederholen Sie die Schritte 2.5 und 2.6.
Klicken Sie bei geöffnetem IDV im Browser auf die Registerkarte Edge-Suche und wählen Sie im Dropdown-Menü den gewünschten Edge-Suchordner aus.
HINWEIS: Wenn in der Edgesuche mehrere Datasets verwendet werden, stellen Sie sicher, dass Sie das letzte Dataset auswählen, das in der LEM-Analyse (Local Edge Machine) verwendet wurde (Tabelle 1). Bei der Auswahl von Kanten für das Seed-Netzwerk oder die Edge-Liste auf der Grundlage von LEM-Ergebnissen ist es wichtig, die letzten in der Konfigurationsdatei aufgeführten Zeitreihendaten zu betrachten, da diese Ausgabe alle vorhergehenden Datendateien in ihre Rückschlüsse auf regulatorische Beziehungen zwischen Knoten einbezieht.
Um die Kantentabelle zu erweitern oder zu kürzen, geben Sie manuell eine Ganzzahl in das Eingabefeld unter Anzahl der Kanten: ein.
Filtern Sie optional Kanten nach den LEM-ODE-Parametern. Klicken und ziehen Sie, um entweder die linke Seite oder die rechte Seite des Schiebereglers jedes Parameters zu verschieben, um Kanten aus der Kantentabelle zu entfernen, deren Parameter außerhalb der neuen zulässigen Parametergrenzen liegen.
Erstellen Sie optional ein neues Seed-Netzwerk, wenn ein anderes Seed-Netzwerk als das vom IDP vorgeschlagene gewünscht wird. Ein Beispiel für eine Seed-Netzwerkdatei finden Sie unter Ergänzungsdatei 8 .
1. Wählen Sie entweder Von Seed aus, um das Seed-Netzwerk auszuwählen, oder Aus Auswahl aus dem Dropdown-Menü unter Netzwerk:.
2. Heben Sie die Auswahl von Kanten aus der Kantentabelle auf, indem Sie die entsprechenden Kontrollkästchen neben jeder Kante aktivieren, um Kanten aus dem Ausgangsnetzwerk zu entfernen/hinzuzufügen.
Klicken Sie auf die Schaltfläche DSGRN NetSpec herunterladen , um das Seed-Netzwerk im Netzwerkspezifikationsformat Dynamic Signatures Generated by Regulatory Networks (DSGRN) (Tabelle 1) herunterzuladen.
Wählen Sie zusätzliche Knoten und Kanten aus, die im Schritt Netzwerksuche verwendet werden sollen.
1. Wählen Sie Kanten aus der Kantentabelle aus, indem Sie die entsprechenden Kontrollkästchen aktivieren, die in die in der Netzwerksuche verwendete Kantenlistendatei aufgenommen werden sollen.
2. Klicken Sie auf Knoten- und Edgelisten herunterladen , um die Knotenlisten- und Edgelistendateien in dem Format herunterzuladen, das für ihre Verwendung in der Netzwerksuche erforderlich ist. Beispiele für Edge- bzw. Knotenlistendateien finden Sie unter Ergänzungsdatei 9 und Ergänzungsdatei 10 .
  HINWEIS: Die Knotenliste muss alle Knoten in der Kantenlistendatei enthalten, sodass der IDV die Knotenlistendatei automatisch basierend auf den ausgewählten Kanten erstellt. Zum Anzeigen der Kanten in der Kantensuche stehen zwei Optionen zur Verfügung. Die Option LEM-Übersichtstabelle stellt die Kanten als Rangliste der 25 besten Kanten dar. Die Top-Line-LEM-Tabelle präsentiert die Kanten in einer verketteten Liste der drei am besten bewerteten Kanten für jeden möglichen Regler. Die Anzahl der für jede Option angezeigten Kanten kann vom Benutzer angepasst werden, indem die Anzahl im Eingabefeld Anzahl der Kanten geändert wird.

4. Netzwerkfindung

Erstellen Sie eine neue IDP-Konfigurationsdatei, die den Schritt Netzwerksuche parametrisiert.
1. Fügen Sie der Konfigurationsdatei die wichtigsten IDP-Argumente hinzu. Öffnen Sie eine neue Textdatei in einem Texteditor und wiederholen Sie Schritt 2.1.1.
2. Fügen Sie der Konfigurationsdatei Argumente für die Netzwerksuche hinzu.
3. Geben Sie in derselben Textdatei wie in Schritt 4.1.1 in der angegebenen Reihenfolge "[netper_arguments]", "edge_list_file =", "node_list_file =", "seed_net_file =", "range_operations =", "numneighbors =", "maxparams =", "[[probabilities]]", "addNode =", "addEdge =", "removeNode =" und "removeEdge =" in einzelnen Zeilen unterhalb der Hauptargumente ein.
4. Geben Sie für "seed_net_file", "edge_list_file" und "node_list_file" nach dem Gleichheitszeichen den Pfad und den Namen der Seed-Netzwerkdatei sowie der Edge- und Knotenlistendateien ein, die in den Schritten 3.9 und 3.10.2 generiert wurden.
5. Geben Sie nach dem Gleichheitszeichen für "range_operations" zwei durch ein Komma getrennte Zahlen ein. Die erste und zweite Zahl sind die minimale bzw. die maximale Anzahl des Hinzufügens oder Entfernens von Knoten oder Kanten pro Netzwerk.
6. Geben Sie für "numneighbors" nach dem Gleichheitszeichen eine Zahl ein, die angibt, wie viele Netzwerke in der Netzwerksuche gesucht werden sollen.
7. Geben Sie für "maxparams" nach dem Gleichheitszeichen eine Zahl ein, die die maximale Anzahl von DSGRN-Parametern für ein Netzwerk darstellt.
8. Geben Sie werte zwischen 0 und 1 für jedes der folgenden Argumente ein: "addNode", "addEdge", "removeNode" und "removeEdge" nach dem Gleichheitszeichen. Die Zahlen müssen sich zu 1 summieren.
  HINWEIS: Es wird dringend empfohlen, die Abschnitte netper_arguments und netquery_arguments in der IDP-README zu lesen, um ein besseres Verständnis der einzelnen Argumente zu erhalten. Beispiele für eine Konfigurationsdatei mit den angegebenen Netzwerkfindungsargumenten finden Sie unter Ergänzungsdatei 11 und Ergänzungsdatei 12 .
Wiederholen Sie die Schritte 2.2 und 2.3.
Führen Sie den IDP mit der in Schritt 4.1 erstellten Konfigurationsdatei aus, indem Sie diesen Befehl im Terminal ausführen, wobei der Name der Datei ist: python src/dat2net.py
Wenn der IDV noch läuft, stoppen Sie ihn, indem Sie im Terminalfenster Control C drücken, um das Programm zu stoppen. Wiederholen Sie die Schritte 2.5 und 2.6.
Klicken Sie bei geöffnetem IDV im Browser auf die Registerkarte Netzwerksuche und wählen Sie den gewünschten Netzwerkordner aus.
Wählen Sie ein Netzwerk oder eine Gruppe von Netzwerken aus, um eine Edge-Prävalenztabelle (Tabelle 1) zu generieren und die Netzwerke zusammen mit ihren jeweiligen Abfrageergebnissen anzuzeigen.
1. Für die Auswahl von Netzwerken stehen zwei Optionen zur Verfügung: Option 1 - Geben Sie untere und obere Grenzen für Abfrageergebnisse ein, indem Sie Minimal- und Maximalwerte in die Eingabefelder eingeben, die der x-Achse und der y-Achse des Diagramms entsprechen. Option 2 - Klicken und ziehen Sie über das Streudiagramm, um ein Feld um die einzuschließenden Netzwerke zu zeichnen. Nachdem Sie die Auswahl- oder Eingabegrenzen eingegeben haben, klicken Sie auf die Schaltfläche Edge-Prävalenz aus ausgewählten Netzwerken abrufen .
  Hinweis: Wenn mehr als eine DSGRN-Abfrage angegeben wurde, verwenden Sie die Optionsfelder mit der Bezeichnung Abfragetyp, um zwischen den Ergebnissen der einzelnen Abfragen zu wechseln. Gleiches gilt, wenn mehr als ein Epsilon (Geräuschpegel) angegeben wurde.
Klicken Sie auf die Pfeile unter der Kantenprävalenztabelle, um zur nächsten Seite der Tabelle zu wechseln. Klicken Sie auf Tabelle herunterladen , um die Edge-Prävalenztabelle herunterzuladen.
Geben Sie eine Ganzzahl in das Eingabefeld Netzwerkindex ein, um ein einzelnes Netzwerk aus der in Schritt 4.6 getroffenen Auswahl anzuzeigen. Klicken Sie auf Download DSGRN NetSpec , um das angezeigte Netzwerk im DSGRN-Netzwerkspezifikationsformat herunterzuladen.
Durchsuchen Sie Netzwerke nach Ähnlichkeit mit einem bestimmten Motiv oder Interessensnetzwerk.
1. Verwenden Sie die Kontrollkästchen, die jeder Kante entsprechen, um Kanten auszuwählen, die in das Netzwerk oder Motiv aufgenommen werden sollen, das bzw. das für die Ähnlichkeitsanalyse verwendet wird. Klicken Sie auf Senden , um das Ähnlichkeits-Streudiagramm für das ausgewählte Motiv oder Netzwerk zu erstellen.
  HINWEIS: Verwenden Sie die Pfeile in der Kantenliste, um alphabetisch zu sortieren, und die Pfeile unter der Tabelle, um zur nächsten Seite der Tabelle zu wechseln.
2. Klicken und ziehen Sie über das Streudiagramm, um ein Feld um die einzuschließenden Netzwerke zu zeichnen, um ein Netzwerk oder eine Gruppe von Netzwerken auszuwählen, um eine Kantenprävalenztabelle zu generieren und die Netzwerke zusammen mit ihren jeweiligen Abfrageergebnissen anzuzeigen.
  Hinweis: Wenn mehr als eine DSGRN-Abfrage angegeben wurde, verwenden Sie die Optionsfelder mit der Bezeichnung Abfragetyp, um zwischen den Ergebnissen der einzelnen Abfragen zu wechseln. Gleiches gilt, wenn mehr als ein Epsilon (Geräuschpegel) angegeben wurde.
3. Wiederholen Sie die Schritte 4.7 und 4.8, um die Kantenprävalenztabelle bzw. das angezeigte Netzwerk für die Ähnlichkeitsanalyse herunterzuladen.

Access restricted. Please log in or start a trial to view this content.

Ergebnisse

Die oben und grafisch in Abbildung 1 beschriebenen Schritte wurden auf den oszillierenden Kern-GRN des Hefezellzyklus angewendet, um zu sehen, ob es möglich ist, funktionelle GRN-Modelle zu entdecken, die in der Lage sind, die Dynamik zu erzeugen, die in Zeitreihen-Genexpressionsdaten beobachtet wurde, die in einer Hefezellzyklusstudie gesammelt ^wurden16. Um zu veranschaulichen, wie der IDV den IDP-Output klären und verbessern kann, wurden die Ergebnisse nach der Du...

Access restricted. Please log in or start a trial to view this content.

Diskussion

Die Inferenz von GRNs ist eine wichtige Herausforderung in der Systembiologie. Der IDP generiert Modell-GRNs aus Genexpressionsdaten mit einer Abfolge von Werkzeugen, die die Daten auf immer komplexere Weise nutzen. Jeder Schritt erfordert Entscheidungen darüber, wie die Daten verarbeitet werden sollen und welche Elemente (Gene, funktionelle Interaktionen) an die nächste Schicht des IDP übergeben werden. Die Auswirkungen dieser Entscheidungen auf die Ergebnisse von Binnenvertriebenen sind nicht so offensichtlich. Um d...

Access restricted. Please log in or start a trial to view this content.

Offenlegungen

Die Autoren haben nichts preiszugeben.

Danksagungen

Diese Arbeit wurde durch den NIH-Zuschuss R01 GM126555-01 und den NSF-Zuschuss DMS-1839299 finanziert.

Access restricted. Please log in or start a trial to view this content.

Materialien

Name	Company	Catalog Number	Comments
Docker			https://docs.docker.com/get-docker/
Git			https://git-scm.com/
Inherent Dynamics Pipeline			https://gitlab.com/biochron/inherent_dynamics_pipeline
Inherent Dynamics Visualizer			https://gitlab.com/bertfordley/inherent_dynamics_visualizer
Miniconda			https://docs.conda.io/en/latest/miniconda.html
Pip			https://pip.pypa.io/en/stable/

Referenzen

Karlebach, G., Shamir, R. Modelling and analysis of gene regulatory networks. Nature Reviews Molecular Cell Biology. 9 (10), 770-780 (2008).
Aijö, T., Lähdesmäki, H. Learning gene regulatory networks from gene expression measurements using non-parametric molecular kinetics. Bioinformatics. 25 (22), 2937-2944 (2009).
Huynh-Thu, V. A., Sanguinetti, G. Combining tree-based and dynamical systems for the inference of gene regulatory networks. Bioinformatics. 31 (10), 1614-1622 (2015).
Oates, C. J., et al. Causal network inference using biochemical kinetics. Bioinformatics. 30 (17), 468-474 (2014).
Marbach, D., et al. Wisdom of crowds for robust gene network inference. Nature Methods. 9 (8), 796-804 (2012).
Inherent Dynamics Pipeline. , Available from: https://gitlab.com/biochron/inherent_dynamics_pipeline (2021).
Motta, F. C., Moseley, R. C., Cummins, B., Deckard, A., Haase, S. B. Conservation of dynamic characteristics of transcriptional regulatory elements in periodic biological processes. bioRxiv. , (2020).
LEMpy. , Available from: https://gitlab.com/biochron/lempy (2021).
McGoff, K. A., et al. The local edge machine: inference of dynamic models of gene regulation. Genome Biology. 17, 214(2016).
Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Model rejection and parameter reduction via time series. SIAM Journal on Applied Dynamical Systems. 17 (2), 1589-1616 (2018).
Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Database of Dynamic Signatures Generated by Regulatory Networks (DSGRN). Lecture Notes in Computer Science. (including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). , 300-308 (2017).
Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. DSGRN: Examining the dynamics of families of logical models. Frontiers in Physiology. 9. 9, 549(2018).
DSGRN. , Available from: https://github.com/marciogameiro/DSGRN (2021).
Dsgm_Net_Gen. , Available from: https://github.com/breecummins/dsgrn_net_gen (2021).
Dsgrn_Net_Query. , Available from: https://github.com/breecummins/dsgrn_net_query (2021).
Orlando, D. A., et al. Global control of cell-cycle transcription by coupled CDK and network oscillators. Nature. 453 (7197), 944-947 (2008).
Monteiro, P. T., et al. YEASTRACT+: a portal for cross-species comparative genomics of transcription regulation in yeasts. Nucleic Acids Research. 48 (1), 642-649 (2020).
de Bruin, R. A. M., et al. Constraining G1-specific transcription to late G1 phase: The MBF-associated corepressor Nrm1 acts via negative feedback. Molecular Cell. 23 (4), 483-496 (2006).
Horak, C. E., et al. Complex transcriptional circuitry at the G1/S transition in Saccharomyces cerevisiae. Genes & Development. 16 (23), 3017-3033 (2002).
Cherry, J. M., et al. Saccharomyces genome database: The genomics resource of budding yeast. Nucleic Acids Research. 40, 700-705 (2012).
Zhu, G., et al. Two yeast forkhead genes regulate the cell cycle and pseudohyphal growth. Nature. 406 (6791), 90-94 (2000).
Loy, C. J., Lydall, D., Surana, U. NDD1, a high-dosage suppressor of cdc28-1N, is essential for expression of a subset of late-S-phase-specific genes in saccharomyces cerevisiae. Molecular and Cellular Biology. 19 (5), 3312-3327 (1999).
Cho, C. Y., Kelliher, C. M., Hasse, S. B. The cell-cycle transcriptional network generates and transmits a pulse of transcription once each cell cycle. Cell Cycle. 18 (4), 363-378 (2019).
Smith, L. M., et al. An intrinsic oscillator drives the blood stage cycle of the malaria parasite Plasmodium falciparum. Science. 368 (6492), 754-759 (2020).

Access restricted. Please log in or start a trial to view this content.

Nachdrucke und Genehmigungen

Genehmigung beantragen, um den Text oder die Abbildungen dieses JoVE-Artikels zu verwenden

Genehmigung beantragen

Inherent Dynamics Visualizer, eine interaktive Anwendung zur Bewertung und Visualisierung von Ergebnissen aus einer Gene Regulatory Network Inference Pipeline

In diesem Artikel

Zusammenfassung

Zusammenfassung

Einleitung

Protokoll

Ergebnisse

Diskussion

Offenlegungen

Danksagungen

Materialien

Referenzen

Nachdrucke und Genehmigungen

Weitere Artikel entdecken