Zirkuläre RNAs spielen eine wichtige regulatorische Rolle in verschiedenen biologischen Prozessen. Dieses Protokoll eignet sich für Einsteiger, um zirkuläre RNA-Analysen im Bereich der Wirts- und Erregerinteraktionen durchzuführen. Hier haben wir einige der Werkzeuge zusammengestellt, die ein optimiertes Protokoll erstellen, das für die sichere RNA-Vorhersage und -Quantifizierung, die sichere RNA-Funktionsanreicherung, die sichere RNA, die Vorhersage der Mikro-RNA-Interaktion und den Aufbau von CCE-RNA-Netzwerken erforderlich ist.
Dieses Rationalisierungsprotokoll kann auf klinische Proben angewendet werden, um bestimmte Kandidaten, diagnostische und prognostische Werte in einer Wirts- und Erregerinteraktion zu identifizieren. Ich erwarte, dass diejenigen, die keine Programmierkenntnisse haben, Schwierigkeiten haben werden, die Anfangsphase dieser Technik durchzuführen. Daher würde ich empfehlen, die Grundlagen der in dieser Technik verwendeten Programmiersprachen zu erlernen.
Ich glaube, dass es normalerweise informativer und leichter zu verstehen ist, wenn man sich ansieht, wie die Programmiersprache angewendet wird, als wenn man nur liest. Öffnen Sie zunächst ein Linux-Terminal und führen Sie im Verzeichnis des Referenzgenoms des Hosts die Befehle bwa index und hisat2-build aus, um das Genom zu indizieren. Bereiten Sie eine yml-Konfigurationsdatei vor, die den Namen der Datei, den Pfad der Tools, den Pfad zu den heruntergeladenen Referenzdateien und den Pfad zu den Indexdateien enthält.
Geben Sie den Bibliothekstyp der RNA-Sequenzdaten an und führen Sie das Ciriquant-Werkzeug entweder mit den Standard- oder manuellen Parametern aus. Bereiten Sie eine Textdatei mit einer Liste von Daten vor, die die IDs der RNA-Sequenzdaten, den Pfad zu den von Ciriquant ausgegebenen GTF-Dateien und die Gruppierung der RNA-Sequenzdaten enthält, unabhängig davon, ob es sich um eine Kontroll- oder eine behandelte Gruppe handelt. Führen Sie auf dem Linux-Terminal prep_Ciriquant mit einer vorbereiteten Textdatei als Eingabe aus.
Bei diesem Lauf wird eine Liste von Dateien generiert. Bereiten Sie eine zweite Textdatei mit einer Liste von Daten vor, die die RNA-Sequenz-IDs und den Pfad zu ihrer jeweiligen String-Tie-Ausgabe enthält. Das Dateilayout muss der zuvor vorbereiteten Textdatei ähneln, ohne dass die Gruppierungsspalte ausgeführt wird.
Führen Sie prepde aus. py mit dieser Textdatei als Eingabe zum Generieren der Genzählmatrixdateien. Führen Sie Ciri_DE_Replicate mit dem library_info aus.
CSV, circRNA_BSJ. CSV und gene_count_matrix. CSV-Dateien als Eingabe für die Ausgabe der endgültigen circRNA_DE.
tsv-Datei. Um die Anzahl der differentiell exprimierten circRNAs zu filtern und zu bestimmen, öffnen Sie die circRNA_DE. tsv-Datei mit R oder einer anderen Tabellenkalkulationssoftware.
Entpacken und extrahieren Sie den Inhalt der CircR-Datei, nachdem Sie sie von der CircR-GitHub-Seite mit der entsprechenden Software wie WinRar oder 7-Zip heruntergeladen haben. In ein neues Verzeichnis, in dem die Analyse durchgeführt wird. Installieren Sie dann die erforderlichen Softwareanwendungen wie SAMTools, miRanda, RNAhybrid und Pybedtools, bevor Sie die circRNA-miRNA-Analyse durchführen.
Indizieren Sie die Referenzgenomdatei des interessierenden Organismus mit dem SAMtools FAIDX-Befehl und bereiten Sie eine Eingabedatei vor, die aus den Koordinaten der gewünschten DE-circRNAs in einer tabulatorgetrennten Bettdatei besteht. Führen Sie als Nächstes Circr aus. py mit Python3.
Und als Argumente geben Sie die circRNA-Eingabedatei, das schnellere Genom des interessierenden Organismus, die Genomversion des ausgewählten Organismus, die Anzahl der Threads und den Namen der Ausgabedatei in der Befehlszeile an. Sobald die Circr-Analyse abgeschlossen ist, gibt das Programm eine circRNA-miRNA-Interaktionsdatei im CSV-Format aus. Bereiten Sie eine tabulatorgetrennte Datei vor, die die interessierenden circRNAs und ihre Ziel-miRNA enthält.
Die erste Spalte besteht aus dem circRNA-Namen. Die zweite Spalte gibt den RNA-Typ aus der ersten Spalte an. Die dritte Säule ist die Ziel-miRNA.
Und die vierte Spalte gibt die Art der RNA aus der dritten Spalte an. Um die ceRNA-Netzwerkkarte zu erstellen, öffnen Sie die Cytoscape-Software, navigieren Sie zu Datei, importieren, vernetzen Sie sich aus Datei, wählen Sie die vorbereitete Datei aus und laden Sie sie hoch. Klicken Sie auf die Schaltfläche style, um den visuellen Stil des Netzwerks zu ändern.
Drücken Sie dann auf den Pfeil auf der rechten Seite der Füllfarbe, wählen Sie Typ für die Spalte, diskretes Mapping für den Mapping-Typ und wählen Sie die gewünschte Farbe für jeden RNA-Typ aus. Navigieren Sie danach zu Form, um die Form der Knoten zu ändern, und befolgen Sie die zuvor gezeigten Schritte. Für die Genontologie und die KEGG-Analyse des elterlichen Gens der circRNAs stellen Sie sicher, dass der Cluster-Profiler und die Org. Hs.eg.
DB-Pakete wurden in unserem Studio installiert. Importieren Sie die DE-circRNA-Informationen in den R Studio-Arbeitsbereich. Wenn der Benutzer die elterlichen Gennamen in andere Formate wie z.B. das entrezid konvertieren möchte, verwenden Sie eine Funktion wie bidder.
Verwenden Sie die Gen-ID als Eingabe und führen Sie die Genontologie- und Anreicherungsanalyse mit der enrichGO-Funktion innerhalb des Clusterprofils oder -pakets mit Standardparametern aus. Führen Sie abschließend die KEGG-Anreicherungsanalyse mit der Gen-ID als Eingabe und der enrichKEGG-Funktion innerhalb des Cluster-Profiler-Pakets aus. Das Blasendiagramm der Genontologie-Anreicherungsanalyse von DE circRNA-Elterngenen ist in dieser Abbildung dargestellt.
Das Genverhältnis auf der x-Achse ist die Anzahl der Gene in dieser Eingabeliste, die einem bestimmten Genontologieterm zugeordnet sind, geteilt durch die Gesamtzahl der Gene in diesem Term. Die Punktgröße im Diagramm wird durch den Zählwert dargestellt, der die Anzahl der Gene in der Eingabeliste angibt, die einem bestimmten Genontologieterm zugeordnet sind. Je größer die Punkte sind, desto größer ist die Anzahl der Eingabegene, die mit dem Begriff verbunden sind.
Die Punkte im Diagramm sind farbkodiert auf der Grundlage des p-Werts, der berechnet wird, indem die beobachtete Häufigkeit eines Annotationsbegriffs mit der zufällig erwarteten Häufigkeit verglichen wird. Die Anreicherung ist statistisch signifikant und wird nur dann im Blasendiagramm dargestellt, wenn der p-Wert kleiner als 0,01 ist. Zu den drei wichtigsten Anreicherungen für die biologischen Prozesse gehören dabei die Biogenese des Ribonukleoproteinkomplexes, die Reaktion auf das Virus und die Regulation der Reaktion auf einen biotischen Reiz.
Während für die molekularen Funktionen nur die katalytische Aktivität, die auf die RNA wirkt, und die einzelsträngige RNA-Bindung statistisch angereichert sind. Für die zellulären Komponenten ist nur der Retromerkomplex statistisch angereichert. Dieses repräsentative Bild zeigt die KEGG-Anreicherungsanalyse der DE circRNA Elterngene in einem Bubble Plot.
Nur zwei KEGG-Terme waren in diesem Fall angereichert, die Influenza A und die viralen Lebenszykluswege. Eines der wichtigsten Dinge beim Versuch dieses Verfahrens besteht darin, den richtigen Merkmalstyp des RNA-Circ-Datensatzes sicherzustellen, den Sie beim Ausführen einer Verletzung verwenden. Die hier bereitgestellte bioformatische Pipeline hilft bei der Vorhersage der potentiellen säkularen RNAs und der funktionellen Annotationen.
Eine gut geführte Überprüfung wird jedoch weiterhin erforderlich sein, um solide Beweise zu liefern. Dieses Protokoll wird es den Forschern ermöglichen, sichere RNA und ihre potenzielle funktionelle Rolle in den verschiedenen Codes und Erregerinteraktionen zu entdecken, die sie weiter untersuchen können.