In Silico Identifizierung und Charakterisierung von circRNAs während Wirt-Pathogen-Interaktionen

Mathanakumara Ealam Selvan; Kai Shen Lim; Chee How Teo; Yat-Yuen Lim

doi:10.3791/64565

Zum Anzeigen dieser Inhalte ist ein JoVE-Abonnement erforderlich. Melden Sie sich an oder starten Sie Ihre kostenlose Testversion.

Method Article

In Silico Identifizierung und Charakterisierung von circRNAs während Wirt-Pathogen-Interaktionen

DOI:

10.3791/64565

⸱

October 21st, 2022

Mathanakumara Ealam Selvan*¹, Kai Shen Lim*¹, Chee How Teo², Yat-Yuen Lim¹

¹Institute of Biological Sciences, Faculty of Science, Universiti Malaya, ²Centre for Research in Biotechnology for Agriculture (CEBAR), Universiti Malaya

* Diese Autoren haben gleichermaßen beigetragen

Please note that all translations are automatically generated. Click here for the English version.

Zusammenfassung

Das hier eingereichte Protokoll erläutert die vollständige In-silico-Pipeline , die für die Vorhersage und funktionelle Charakterisierung von circRNAs aus RNA-Sequenzierungs-Transkriptomdaten zur Untersuchung von Wirt-Pathogen-Interaktionen erforderlich ist.

Zusammenfassung

Zirkuläre RNAs (circRNAs) sind eine Klasse nicht-kodierender RNAs, die durch Back-Sppleißen gebildet werden. Diese circRNAs werden vor allem auf ihre Rolle als Regulatoren verschiedener biologischer Prozesse untersucht. Bemerkenswert ist, dass neue Erkenntnisse zeigen, dass Wirts-circRNAs bei einer Infektion mit Krankheitserregern (z. B. Influenza und Coronaviren) differentiell exprimiert werden können, was auf eine Rolle von circRNAs bei der Regulierung der angeborenen Immunantwort des Wirts hindeutet. Untersuchungen zur Rolle von circRNAs bei pathogenen Infektionen sind jedoch begrenzt durch die Kenntnisse und Fähigkeiten, die erforderlich sind, um die notwendigen bioinformatischen Analysen durchzuführen, um DE-circRNAs aus RNA-Sequenzierungsdaten (RNA-seq) zu identifizieren. Die bioinformatische Vorhersage und Identifizierung von circRNAs ist von entscheidender Bedeutung vor jeder Verifizierung und funktionellen Studien mit kostspieligen und zeitaufwändigen Nasslabortechniken. Um dieses Problem zu lösen, wird in diesem Manuskript ein Schritt-für-Schritt-Protokoll zur In-silico-Vorhersage und Charakterisierung von circRNAs unter Verwendung von RNA-seq-Daten bereitgestellt. Das Protokoll kann in vier Schritte unterteilt werden: 1) Vorhersage und Quantifizierung von DE-circRNAs über die CIRIquant-Pipeline; 2) Annotation mittels circBase und Charakterisierung von DE circRNAs; 3) Vorhersage der CircRNA-miRNA-Interaktion durch die Circr-Pipeline; 4) Analyse der funktionellen Anreicherung von circRNA-Elterngenen unter Verwendung von Gene Ontology (GO) und Kyoto Encyclopedia of Genes and Genomes (KEGG). Diese Pipeline wird nützlich sein, um die zukünftige In-vitro - und In-vivo-Forschung voranzutreiben, um die Rolle von circRNAs bei Wirt-Pathogen-Interaktionen weiter zu entschlüsseln.

Einleitung

Wirt-Pathogen-Interaktionen stellen ein komplexes Zusammenspiel zwischen den Krankheitserregern und den Wirtsorganismen dar, das die angeborenen Immunantworten des Wirts auslöst, die schließlich zur Entfernung eindringender Krankheitserreger führen ^1,2. Bei pathogenen Infektionen wird eine Vielzahl der Immungene des Wirts reguliert, um die Vermehrung und Freisetzung von Krankheitserregern zu hemmen. Zu den häufigen Interferon-stimulierten Genen (ISGs), die bei pathogenen Infektionen reguliert werden, gehören ADAR1, IFIT1, IFIT2, IFIT3, ISG20, RIG-I und OASL ^3,4. Studien haben gezeigt, dass neben proteinkodierenden Genen auch nicht-kodierende RNAs wie lange nicht-kodierende RNAs (lncRNAs), microRNAs (miRNAs) und zirkuläre RNAs (circRNAs) eine Rolle spielen und gleichzeitig bei pathogenen Infektionen reguliert werden ^5,6,7. Im Gegensatz zu proteinkodierenden Genen, die Proteine hauptsächlich als funktionelle Moleküle kodieren, sind nicht-kodierende RNAs (ncRNAs) als Regulatoren von Genen auf transkriptioneller und posttranskriptioneller Ebene bekannt. Allerdings sind Studien, in denen nicht-kodierende RNAs, insbesondere circRNAs, an der Regulation der Immungene des Wirts beteiligt sind, im Vergleich zu den proteinkodierenden Genen nicht gut berichtet.

CircRNAs zeichnen sich weitgehend durch ihre kovalent geschlossene Endlosschleifenstruktur aus, die durch einen nicht-kanonischen Spleißprozess namens Back-Spleißen⁸ erzeugt wird. Im Gegensatz zum Spleißen verwandter linearer RNAs wird beim Back-Splicing die nachgeschaltete Donorstelle an die stromaufwärts gelegene Akzeptorstelle ligiert, wodurch eine kreisförmige Struktur entsteht. Derzeit werden drei verschiedene Back-Spleiß-Mechanismen für die Biogenese von circRNAs vorgeschlagen. Dabei handelt es sich um RNA-bindende Proteine (RBP)-vermittelte Zirkularisierung 9,10, Intron-Paarungs-getriebene Zirkularisierung 11 und Lariat-getriebene Zirkularisierung^12,13,14. Da circRNAs in einer kreisförmigen Struktur Ende-zu-Ende verbunden sind, neigen sie dazu, von Natur aus resistent gegen normale Exonuklease-Verdauungen zu sein und gelten daher als stabiler als ihre linearen Gegenstücke¹⁵. Ein weiteres gemeinsames Merkmal von circRNAs ist die zell- oder gewebetypspezifische Expression in Wirten¹⁶.

Wie ihre einzigartige Struktur und ihre zell- oder gewebespezifische Expression vermuten lassen, haben circRNAs wichtige biologische Funktionen in Zellen übernommen. Bis heute ist eine der herausragenden Funktionen von circRNAs ihre Rolle als microRNA (miRNA)-Schwämme^17,18. Diese regulatorische Rolle von circRNAs erfolgt durch die komplementäre Bindung von circRNA-Nukleotiden an die Seed-Region von miRNAs. Eine solche circRNA-miRNA-Interaktion hemmt die normalen regulatorischen Funktionen der miRNAs auf den Ziel-mRNAs und reguliert so die Expression der Gene^19,20. Darüber hinaus ist bekannt, dass circRNAs die Genexpression regulieren, indem sie mit RNA-bindenden Proteinen (RBPs) interagieren und RNA-Protein-Komplexe bilden²¹. Obwohl circRNAs als nicht-kodierende RNAs klassifiziert werden, gibt es auch Hinweise darauf, dass circRNAs als Vorlagen für die Proteintranslation fungieren können^22,23,24.

In jüngster Zeit wurde gezeigt, dass circRNAs eine zentrale Rolle bei der Regulierung der Wirt-Pathogen-Interaktionen spielen, insbesondere zwischen Wirt und Viren. Im Allgemeinen wird angenommen, dass Wirts-circRNAs bei der Regulierung der Immunantwort des Wirts helfen, um die eindringenden Krankheitserreger zu eliminieren. Ein Beispiel für circRNA, die die Immunantwort des Wirts fördert, ist circRNA_0082633, berichtet von Guo et ^al.25. Diese circRNA verstärkt die Signalübertragung von Typ-I-Interferon (IFN) in A549-Zellen, was dazu beiträgt, die Replikation von Influenzaviren zu unterdrücken²⁵. Darüber hinaus berichteten Qu et al. auch über eine humane intronische circRNA, genannt circRNA AIVR, die die Immunität fördert, indem sie die Expression des CREB-bindenden Proteins (CREBBP), einem Signalwandler von IFN-β^{reguliert 26,27}. Es gibt jedoch auch circRNAs, von denen bekannt ist, dass sie die Pathogenese von Krankheiten bei einer Infektion fördern. So berichteten Yu et al. kürzlich über die Rolle einer circRNA, die aus der GATA-Zinkfingerdomäne gespleißt wird, die das 2A-Gen (circGATAD2A) enthält, bei der Förderung der Replikation des H1N1-Virus durch die Hemmung der Autophagie der Wirtszelle²⁸.

Um circRNAs effektiv untersuchen zu können, wird in der Regel ein genomweiter circRNA-Vorhersagealgorithmus implementiert, gefolgt von einer In-silico-Charakterisierung der vorhergesagten circRNA-Kandidaten, bevor funktionelle Studien durchgeführt werden können. Ein solcher bioinformatischer Ansatz zur Vorhersage und Charakterisierung von circRNAs ist kostengünstiger und zeiteffizienter. Es hilft, die Anzahl der Kandidaten zu verfeinern, die funktionell untersucht werden sollen, und könnte möglicherweise zu neuen Erkenntnissen führen. In dieser Arbeit stellen wir ein detailliertes bioinformatisches Protokoll für die in silico Identifizierung, Charakterisierung und funktionelle Annotation von circRNAs während der Wirt-Pathogen-Interaktionen zur Verfügung. Das Protokoll umfasst die Identifizierung und Quantifizierung von circRNAs aus RNA-Sequenzierungsdatensätzen, die Annotation über circBase und die Charakterisierung der circRNA-Kandidaten in Bezug auf circRNA-Typen, Anzahl überlappender Gene und vorhergesagte circRNA-miRNA-Interaktionen. Diese Studie liefert auch die funktionelle Annotation der circRNA-Elterngene durch Genontologie (GO) und die Anreicherungsanalyse der Kyoto Encyclopedia of Genes and Genomes (KEGG).

Protokoll

In diesem Protokoll wurden de-identifizierte ribosomale RNA (rRNA)-depletierte RNA-seq-Bibliotheksdatensätze, die aus den mit dem Influenza-A-Virus infizierten menschlichen Makrophagenzellen erstellt wurden, aus der Gene Expression Omnibus (GEO)-Datenbank heruntergeladen und verwendet. Die gesamte bioinformatische Pipeline von der Vorhersage bis zur funktionellen Charakterisierung von circRNAs ist in Abbildung 1 zusammengefasst. Jeder Teil der Pipeline wird in den folgenden Abschnitten näher erläutert.

1. Vorbereitung, Download und Einrichtung vor der Datenanalyse

HINWEIS: Alle in dieser Studie verwendeten Softwarepakete sind kostenlos und quelloffen.

Herunterladen der erforderlichen Tools auf der Linux-Plattform
1. Laden Sie die erforderliche Software und die Tools, die im Materialverzeichnis aufgeführt sind, herunter und installieren Sie sie auf einem Linux-Hochleistungscomputer, indem Sie die Anweisungen des Entwicklers befolgen.
  HINWEIS: Die meisten Tools und Software verfügen über eigene Online-GitHub-Seiten oder Dokumentationen mit Anweisungen zur Installation und Verwendung ihrer Tools (siehe Materialtabelle).
2. Laden Sie die gewünschten RNA-seq-Datensätze für die circRNA-Detektion und -Analyse von Sequenzarchiv-Websites herunter (z. B. European Nucleotides Archive und Gene Expression Omnibus).
3. Laden Sie die Referenzgenome (FASTA-Format) und Annotationsdateien (GTF/GFF3-Format) herunter, die mit dem Host kompatibel sind, von dem der RNA-seq-Datensatz erstellt wurde. Referenzgenome und Annotationsdateien des Wirts sind in der Regel in Online-Genombrowsern wie dem National Center for Biotechnology Information (NCBI), der University of California Santa Cruz (UCSC) und den Ensembl-Websites zu finden.
Qualitätsprüfung von RNA-seq
1. Geben Sie die FASTQ-Dateien in das FASTQC-Programm ein, um die Qualität der RNA-Sequenzen zu bestimmen. Wenn die Qualität der FASTQ-Dateien niedrig ist (z. B. 29,30 erforderlich sein.

2. Vorhersage und differentielle Expressionsanalyse von circRNAs mit CIRIquant

HINWEIS: Ein ausführlicheres Handbuch zur Installation und Durchführung der Differentialexpressionsanalyse finden Sie im Abschnitt Codeverfügbarkeit des CIRIquant-Papiers³¹. Die ergänzenden Daten enthalten auch einige der grundlegenden Befehle, die in diesem Protokoll verwendet werden.

CircRNA-Vorhersagen
1. Indizieren Sie zuerst das Referenzgenom des Wirts mit BWA- und HISAT2-Alignern. Führen Sie dann auf einem Linux-Terminal die Befehle bwa index 32 und hisat2-build³³ im Verzeichnis des Referenzgenoms des Hosts aus, um es zu indizieren.
2. Bereiten Sie als Nächstes eine YML-Konfigurationsdatei vor, die den Namen der Datei, den Pfad der Tools (BWA, HISAT2, stringtie³⁴, samtools³⁵), den Pfad zu den heruntergeladenen Referenzdateien (FASTA-Dateien des Referenzgenoms des Hosts, Annotationsdateien) und den Pfad zu den Indexdateien aus Schritt 2.1.1 enthält.
3. Führen Sie das CIRIquant-Tool vom Terminal aus mit den Standard- oder manuellen Parametern aus. Der Benutzer kann den Bibliothekstyp (entweder stranged oder non-stranged) der RNA-seq-Daten angeben, wenn er das CIRIquant-Tool ausführt.
  HINWEIS: Der Bibliothekstyp der RNA-seq-Daten kann bestimmt werden, indem der Typ des verwendeten Bibliotheksvorbereitungskits bekannt ist. Wenn die Identität des Bibliothekspräparationskits unbekannt ist, kann ein bioinformatisches RNA-seq-Kontrollpaket namens RSeQC³⁶ verwendet werden, um die Strandedness von RNA-seq-Daten zu bestimmen.
Differentielle Expressionsanalyse
HINWEIS: Das CIRIquant-Paket enthält prep_CIRIquant, prepDE.py und CIRI_DE_replicate; Daher sind für diese drei Tools keine zusätzlichen Downloads erforderlich.
1. Bereiten Sie eine Textdatei (.lst) mit einer Liste von Daten vor, die Folgendes enthält:
  1^{. Spalte} : IDs der in Schritt 2.1.3 verwendeten RNA-seq-Daten
  2^. Spalte: Pfad zu den GTF-Dateien, die von CIRIquant ausgegeben werden
  3. Spalte: Gruppierung der RNA-seq-Daten, unabhängig davon, ob es sich um eine Kontroll- oder eine behandelte Gruppe handelt^.
2. Ein Beispiel finden Sie in Tabelle 1 unten.
  HINWEIS: Es ist nicht notwendig, die Kopfzeilen einzufügen, da sie nur als Referenz dienen.
3. Führen Sie auf dem Linux-Terminal prep_CIRIquant mit der in Schritt 2.2.1 vorbereiteten Textdatei (.lst) als Eingabe aus. Bei der Ausführung wird eine Liste von Dateien generiert: library_info.csv, circRNA_info.csv, circRNA_bsj.csv und circRNA_ratio.csv.
4. Bereiten Sie eine zweite Textdatei mit einer Liste von Daten vor, die die RNA-seq-IDs und den Pfad zu ihrer jeweiligen StringTie-Ausgabe enthält. Das Dateilayout muss der Textdatei in Schritt 2.2.1 ohne die Gruppierungsspalte ähneln.
5. Führen Sie prepDE.py mit der in Schritt 2.2.4 vorbereiteten Textdatei als Eingabe aus, um die Genzählmatrixdateien zu generieren.
6. Führen Sie CIRI_DE_replicate mit den library_info.csv - und circRNA_bsj.csv Dateien aus Schritt 2.2.3 und der gene_count_matrix.csv Datei aus Schritt 2.2.5 als Eingaben aus, um die endgültige circRNA_de.tsv-Datei auszugeben.
Filterung von DE-circRNAs
1. Verwenden Sie R (im Computerterminal oder RStudio) oder eine beliebige Tabellenkalkulationssoftware (z. B. Microsoft Excel), um die aus Schritt 2.2.6 generierte Datei circRNA_de.tsv zu öffnen, um die Anzahl der differentiell exprimierten (DE) circRNAs zu filtern und zu bestimmen.
2. Filtern Sie die DE-circRNAs nach den Kriterien LogFC > |2| und FDR < 0,05.
3. Erstellen Sie eine Datei mit dem Namen DE_circRNAs.txt , um die Informationen von DE-circRNAs zu speichern.

3. Charakterisierung und Annotation von vorhergesagten DE-circRNAs

Annotationsstatus von DE-circRNAs
1. Laden Sie die Datei mit dem Namen DE_circRNAs.txt in RStudio , die aus der Liste der DE-circRNAs besteht, die aus Schritt 2.3.3 gefiltert wurden. Fügen Sie weitere Informationen hinzu, wie z. B. die genomischen Positionen (Chr, Start, Ende), die Strangorientierung (+ oder -), den Gennamen und den circRNA-Typ. Bevor Sie fortfahren, konvertieren Sie die genomischen Startkoordinaten der circRNA von CIRIquant in 0-basiert, indem Sie 1 Basenpaar subtrahieren.
  HINWEIS: Die anderen oben genannten Informationen können den GTF-Dateien entnommen werden, die von CIRIquant (Supplementary File 1) ausgegeben werden.
2. Bestimmen Sie den Annotationsstatus der vorhergesagten DE-circRNAs, indem Sie eine Bibliothek herunterladen, die die genomischen Positionen der in der circRNA-Datenbank (z.B. circBase) hinterlegten circRNAs enthält.
  HINWEIS: Stellen Sie sicher, dass die Genomversion, die zur Vorhersage der circRNAs verwendet wird, mit der circRNA-Datenbankbibliothek identisch ist, bevor Sie den Vergleich durchführen. Die hier verwendete circBase-Datendatei ist in dem in Github (https://github.com/bicciatolab/Circr)³⁷ bereitgestellten Laufwerksordner frei verfügbar.
3. Sobald die beiden Dateien aus Schritt 3.1.1 und Schritt 3.1.2 vorbereitet sind, führen Sie das in Ergänzende Datei 1 angegebene R-Skript aus. Chromosomale Positionen von DE-circRNAs werden an die Bibliothek abgefragt, bevor ihnen der Status Annotated oder Unannotated zugewiesen wird.
Charakterisierung von DE-circRNAs
1. Verwenden Sie R und andere Tabellenkalkulationsprogramme, um die Anzahl der circRNAs entsprechend den circRNA-Typen (d. h. Exon, Intron, intergen und Antisense) und die Anzahl der Gene, über die sich die circRNAs erstrecken (1 oder >1), zusammenzufassen (Ergänzungsdatei 1).HINWEIS: CIRIquant kann nur vier Arten von circRNAs nachweisen (Exon, Intron, intergen und Antisense). Exon-Intron-circRNAs, auch ElciRNAs genannt, können von CIRIquant nicht nachgewiesen werden.

4. Vorhersage der circRNA-miRNA-Interaktion mit Circr

HINWEIS: Eine ausführlichere Anleitung zur Installation und Verwendung von Circr für die circRNA-miRNA-Interaktionsanalyse finden Sie unter: https://github.com/bicciatolab/Circr³⁷.

Vorbereitung von Dateien
1. Entpacken und extrahieren Sie den Inhalt der Circr.zip Datei, nachdem Sie sie von der Circr GitHub-Seite mit der entsprechenden Software wie "WinRar" oder "7-zip" heruntergeladen haben, in ein neues Verzeichnis, in dem die Analyse durchgeführt wird.
2. Installieren Sie die erforderlichen Softwareanwendungen (miRanda, RNAhybrid, Pybedtools und samtools), bevor Sie die circRNA-miRNA-Analyse durchführen.
3. Referenzgenome und Annotationsdateien für verschiedene Organismen von Interesse, eine rRNA-Koordinatendatei, eine validierte miRNA-Interaktionsdatei und circBase-circRNA-Dateien werden vom Circr-Autor auf der Github-Seite (https://github.com/bicciatolab/Circr)³⁷ bereitgestellt. Wenn Sie auf die Unterstützungsdateien im Laufwerksordner klicken, wählen Sie den Ordner für den gewünschten Organismus, den miRNA-Ordner und die circBase-Textdatei aus und laden Sie sie herunter.
4. Nachdem Sie die erforderlichen Dateien in Schritt 4.1.3 heruntergeladen haben, erstellen Sie ein neues Verzeichnis mit dem Namen support_files in dem in Schritt 4.1.1 genannten Verzeichnis. Entpacken Sie dann den Inhalt und extrahieren Sie ihn in das support_files Verzeichnis.
5. Indizieren Sie die Referenzgenomdatei des interessierenden Organismus mit dem Befehl samtools faidx (Supplementary File 1).
6. Bereiten Sie eine Eingabedatei vor, die aus den Koordinaten der gewünschten DE-circRNAs in einer tabulatorgetrennten BED-Datei besteht, wie in Tabelle 2 dargestellt.
  HINWEIS: Da circRNAs, die von CIRIquant vorhergesagt werden, nicht 0-basiert sind, ist es notwendig, 1 bp an der Startkoordinate zu minuieren (wie in Schritt 3.1.1 erwähnt), bevor sie in das BED-Format konvertiert werden. Die in Tabelle 2 gezeigten Header dienen nur als Referenz und werden in den BED-Dateien nicht benötigt.
7. Stellen Sie an dieser Stelle sicher, dass die erwartete Ordnerstruktur für die Circr-Analyse mit der in Abbildung 2 dargestellten Struktur übereinstimmt.
Ausführen Circr.py
1. Führen Sie Circr.py mit Python 3 aus, und geben Sie als Argumente die circRNA-Eingabedatei, das FASTA-Genom des gewünschten Organismus, die Genomversion des ausgewählten Organismus, die Anzahl der Threads und den Namen der Ausgabedatei in der Befehlszeile an.
2. Wenn der betreffende Organismus nicht in dem in Schritt 4.1.3 aufgeführten Laufwerksordner bereitgestellt wird oder wenn der Benutzer es vorzieht, einen benutzerdefinierten Satz von Dateien zum Ausführen der Analyse zu haben, müssen beim Ausführen von Circr.py zusätzliche Befehle enthalten sein, die den Speicherort dieser Dateien angeben.
3. Nachdem die Circr-Analyse abgeschlossen ist, gibt das Programm eine circRNA-miRNA-Interaktionsdatei im csv-Format aus.
4. Filtern Sie die Ergebnisse der circRNA-miRNA-Interaktion entsprechend der benutzerspezifischen Präferenz. Für diese Studie werden die Vorhersagen mit Rstudio nach den folgenden Kriterien gefiltert:
  -Wird von allen drei Software-Tools erkannt
  -Zwei oder mehr Bindungsstellen, die sowohl von Targetscan als auch von miRanda gemeldet werden
  -Wird entweder in den Spalten "AGO" oder "validiert" identifiziert
  -Filtern Sie keine Seed-Region-Interaktionen heraus
5. Schreiben Sie die circRNAs, die die gefilterten Bedingungen aus Schritt 4.2.3 übergeben, in eine neue Textdatei mit dem Namen circRNA_miRNA.txt. Eine solche Filterung kann die Zuverlässigkeit der vorhergesagten Wechselwirkungen erhöhen.

5. Aufbau des ceRNA-Netzwerks

HINWEIS: Eine ausführliche Anleitung zur Verwendung von Cytoscape finden Sie unter: http://manual.cytoscape.org/en/stable/ und https://github.com/cytoscape/cytoscape-tutorials/wiki#introduction

Download und Vorbereitung
1. Laden Sie die neueste Version von Cytoscape³⁸ herunter von: https://cytoscape.org/download.html.
2. Führen Sie den in Schritt 5.1.1 heruntergeladenen Installationsassistenten aus und wählen Sie den Speicherort für die Cytoscape-Software aus.
3. Bereiten Sie eine tabulatorgetrennte Datei vor, die die interessierenden circRNAs und ihre Ziel-miRNA enthält. Die erste Spalte besteht aus dem circRNA-Namen; die zweite Spalte gibt den RNA-Typ aus der ersten Spalte an. die dritte Spalte ist die Ziel-miRNA; und die vierte Spalte gibt die Art der RNA aus der dritten Spalte an. Ein Beispiel für die Datei ist in Tabelle 3 dargestellt.
Aufbau der ceRNA-Netzwerkkarte
1. Öffnen Sie die in Schritt 5.1.2 installierte Cytoscape-Software.
2. Navigieren Sie in Cytoscape zu Datei > importieren Sie > Netzwerk aus Datei. Wählen Sie die Datei aus, die in Schritt 5.1.3 vorbereitet wurde.
3. Wählen Sie auf der neuen Registerkarte die erste und zweite Spalte als "Quellknoten" und "Quellknotenattribut" aus, während Sie die dritte und vierte Spalte als "Zielknoten" bzw. "Zielknotenattribut" auswählen. Klicken Sie auf OK und das Netzwerk wird oben rechts in Cytoscape angezeigt.
4. Um den visuellen Stil des Netzwerks zu ändern, klicken Sie auf die Schaltfläche Stil auf der linken Seite von Cytoscape.
5. Drücken Sie auf den Pfeil auf der rechten Seite von Füllfarbe. Wählen Sie Typ für die Spalte und Diskrete Zuordnung für den Zuordnungstyp. Wählen Sie dann die gewünschte Farbe für jeden der RNA-Typen aus.
6. Nachdem Sie die Farbe geändert haben, ändern Sie die Form der Knoten, indem Sie zu Form navigieren und Schritt 5.2.5 ausführen.

6. Analyse der funktionalen Anreicherung

Genontologie (GO) und Kyoto Encyclopedia of Genes and Genomes (KEGG) Analyse für das Elterngen der circRNAs
1. Stellen Sie sicher, dass clusterProfiler^39,40 und org. Hs.B.db⁴¹ Pakete wurden in Rstudio installiert. Die org. Hs.eg.db^41-Paket ist ein genomweites Annotationspaket nur für Menschen. Wenn es sich bei dem interessierenden Organismus um eine andere Art handelt, siehe: https://bioconductor.org/packages/release/BiocViews.html#OrgDb
2. Importieren Sie die DE_circRNA Informationen aus Schritt 2.3.1 in den Rstudio-Arbeitsbereich.
3. Verwenden Sie das elterliche Gen der circRNAs, die in dieser Datei bereitgestellt werden, für die Anreicherungsanalyse in den nächsten Schritten. Wenn der Benutzer jedoch das Gensymbol in andere Formate, wie z. B. die Entrez-ID, konvertieren möchte, verwenden Sie eine Funktion wie "bitr".
4. Wenn Sie die Gen-ID als Eingabe verwenden, führen Sie die GO-Anreicherungsanalyse mit der enrichGO-Funktion innerhalb des clusterProfiler 39,40-Pakets mit Standardparametern aus.
5. Wenn Sie die Gen-ID als Eingabe verwenden, führen Sie die KEGG-Anreicherungsanalyse mit der enrichKEGG-Funktion innerhalb des clusterProfiler 39,40-Pakets mit den Standardparametern aus.

Ergebnisse

Das im vorherigen Abschnitt aufgeführte Protokoll wurde modifiziert und konfiguriert, um dem Linux-Betriebssystem gerecht zu werden. Der Hauptgrund dafür ist, dass die meisten Modulbibliotheken und Pakete, die an der Analyse von circRNAs beteiligt sind, nur auf der Linux-Plattform funktionieren können. In dieser Analyse wurden de-identifizierte ribosomale RNA (rRNA)-depletierte RNA-seq-Bibliotheksdatensätze, die aus den mit dem Influenza-A-Virus infizierten menschlichen Makrophagenzellen hergestellt wurden, aus der G...

Diskussion

Um den Nutzen dieses Protokolls zu veranschaulichen, wurde RNA-seq aus mit dem Influenza-A-Virus infizierten humanen Makrophagenzellen als Beispiel verwendet. CircRNAs, die als potentielle miRNA-Schwämme in Wirt-Pathogen-Interaktionen fungieren, und ihre GO- und KEGG-funktionelle Anreicherung innerhalb eines Wirts wurden untersucht. Obwohl es eine Vielzahl von circRNA-Tools gibt, die online verfügbar sind, ist jedes von ihnen ein eigenständiges Paket, das nicht miteinander interagiert. Hier stellen wir einige der Werk...

Offenlegungen

Die Autoren haben nichts zu verraten.

Danksagungen

Der Autor dankt Tan Ke En und Dr. Cameron Bracken für die kritische Durchsicht dieses Manuskripts. Diese Arbeit wurde durch Zuschüsse aus dem Fundamental Research Grant Scheme (FRGS/1/2020/SKK0/UM/02/15) und dem University of Malaya High Impact Research Grant (UM. C/625/1/HIR/MOE/CHAN/02/07).

Materialien

Name	Company	Catalog Number	Comments
Bedtools	GitHub	https://github.com/arq5x/bedtools2/	Referring to section 4.1.2. Needed for Circr.
BWA	Burrows-Wheeler Aligner	http://bio-bwa.sourceforge.net/	Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Circr	GitHub	https://github.com/bicciatolab/Circr	Referring to section 4. Use to predict the miRNA binding sites
CIRIquant	GitHub	https://github.com/bioinfo-biols/CIRIquant	Referring to section 2.1.3. To predict circRNAs
Clusterprofiler	GitHub	https://github.com/YuLab-SMU/clusterProfiler	Referring to section 7. For GO and KEGG functional enrichment
CPU	Intel	Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000)	Specifications used to run this entire protocol.
Cytoscape	Cytoscape	https://cytoscape.org/download.html	Referring to section 5.2. Needed to plot ceRNA network
FastQC	Babraham Bioinformatics	https://www.bioinformatics.babraham.ac.uk/projects/fastqc/	Referring to section 1.2.1. Quality checking on Fastq files
HISAT2		http://daehwankimlab.github.io/hisat2/	Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
Linux	Ubuntu 20.04.5 LTS (Focal Fossa)	https://releases.ubuntu.com/focal/	Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol.
miRanda		http://www.microrna.org/microrna/getDownloads.do	Referring to section 4.1.2. Needed for Circr
Pybedtools	pybedtools 0.8.2	https://pypi.org/project/pybedtools/	Needed for BED file genomic manipulation
Python	Python 2.7 and 3.6 or abover	https://www.python.org/downloads/	To run necessary library modules
R	The Comprehensive R Archive Network	https://cran.r-project.org/	To manipulate dataframes
RNAhybrid	BiBiServ	https://bibiserv.cebitec.uni-bielefeld.de/rnahybrid	Referring to section 4.1.2. Needed for Circr
RStudio	RStudio	https://www.rstudio.com/	A workspace to run R
samtools	SAMtools	http://www.htslib.org/	Referring to section 2.1.2. Needed to run CIRIquant
StringTie	Johns Hopkins University: Center for Computational Biology	http://ccb.jhu.edu/software/stringtie/index.shtml	Referring to section 2.1.2. Needed to run CIRIquant
TargetScan	GitHub	https://github.com/nsoranzo/targetscan	Referring to section 4.1.2. Needed for Circr

Referenzen

Raman, K., Bhat, A. G., Chandra, N. A systems perspective of host-pathogen interactions: predicting disease outcome in tuberculosis. Molecular BioSystems. 6 (3), 516-530 (2010).
Casadevall, A., Pirofski, L. A. Host-pathogen interactions: basic concepts of microbial commensalism, colonization, infection, and disease. Infection and Immunity. 68 (12), 6511-6518 (2000).
Yang, E., Li, M. M. H. All About the RNA: Interferon-stimulated genes that interfere with viral RNA processes. Frontiers in Immunology. 11, 605024 (2020).
Schneider, W. M., Chevillotte, M. D., Rice, C. M. Interferon-stimulated genes: A complex web of host defenses. Annual Review of Immunology. 32 (1), 513-545 (2014).
Shirahama, S., Miki, A., Kaburaki, T., Akimitsu, N. Long non-coding RNAs involved in pathogenic infection. Frontiers in Genetics. 11, 454 (2020).
Chandan, K., Gupta, M., Sarwat, M. Role of host and pathogen-derived microRNAs in immune regulation during infectious and inflammatory diseases. Frontiers in Immunology. 10, 3081 (2019).
Chen, X., et al. Circular RNAs in immune responses and immune diseases. Theranostics. 9 (2), 588-607 (2019).
Kristensen, L. S., et al. The biogenesis, biology and characterization of circular RNAs. Nature Reviews Genetics. 20 (11), 675-691 (2019).
Ashwal-Fluss, R., et al. circRNA biogenesis competes with pre-mRNA splicing. Molecular Cell. 56 (1), 55-66 (2014).
Conn, S. J., et al. The RNA binding protein quaking regulates formation of circRNAs. Cell. 160 (6), 1125-1134 (2015).
Zhang, X. O., et al. Complementary sequence-mediated exon circularization. Cell. 159 (1), 134-147 (2014).
Robic, A., Demars, J., Kuhn, C. In-depth analysis reveals production of circular RNAs from non-coding sequences. Cells. 9 (8), 1806 (2020).
Eger, N., Schoppe, L., Schuster, S., Laufs, U., Boeckel, J. N. Circular RNA splicing. Advances in Experimental Medicine and Biology. 1087, 41-52 (2018).
Barrett, S. P., Wang, P. L., Salzman, J. Circular RNA biogenesis can proceed through an exon-containing lariat precursor. eLife. 4, 07540 (2015).
Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
Misir, S., Wu, N., Yang, B. B. Specific expression and functions of circular RNAs. Cell Death and Differentiation. 29 (3), 481-491 (2022).
Bai, S., et al. Construct a circRNA/miRNA/mRNA regulatory network to explore potential pathogenesis and therapy options of clear cell renal cell carcinoma. Scientific Reports. 10 (1), 13659 (2020).
Sakshi, S., Jayasuriya, R., Ganesan, K., Xu, B., Ramkumar, K. M. Role of circRNA-miRNA-mRNA interaction network in diabetes and its associated complications. Molecular Therapy - Nucleic Acids. 26, 1291-1302 (2021).
Hansen, T. B., et al. miRNA-dependent gene silencing involving Ago2-mediated cleavage of a circular antisense RNA. The EMBO Journal. 30 (21), 4414-4422 (2011).
Lu, M. Circular RNA: functions, applications, and prospects. ExRNA. 2 (1), 15 (2020).
Liu, K. S., Pan, F., Mao, X. D., Liu, C., Chen, Y. J. Biological functions of circular RNAs and their roles in occurrence of reproduction and gynecological diseases. American Journal of Translational Research. 11 (1), 1-15 (2019).
Pamudurti, N. R., et al. Translation of CircRNAs. Molecular Cell. 66 (1), 9-21 (2017).
Legnini, I., et al. Circ-ZNF609 Is a circular RNA that can be translated and functions in myogenesis. Molecular Cell. 66 (1), 22-37 (2017).
Weigelt, C. M., et al. An insulin-sensitive circular RNA that regulates lifespan in Drosophila. Molecular Cell. 79 (2), 268-279 (2020).
Guo, Y., et al. Identification and characterization of circular RNAs in the A549 cells following Influenza A virus infection. Veterinary Microbiology. 267, 109390 (2022).
Qu, Z., et al. A novel intronic circular RNA antagonizes influenza virus by absorbing a microRNA that degrades CREBBP and accelerating IFN-β production. mBio. 12 (4), 0101721 (2021).
Kawarada, Y., et al. TGF-β induces p53/Smads complex formation in the PAI-1 promoter to activate transcription. Scientific Reports. 6 (1), 35483 (2016).
Yu, T., et al. Circular RNA GATAD2A promotes H1N1 replication through inhibiting autophagy. Veterinary Microbiology. 231, 238-245 (2019).
FastQC: A quality control tool for high throughput sequence data. Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010)
Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
Zhang, J., Chen, S., Yang, J., Zhao, F. Accurate quantification of circular RNAs identifies extensive circular isoform switching events. Nature Communications. 11 (1), 90 (2020).
Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
Kim, D., Paggi, J. M., Park, C., Bennett, C., Salzberg, S. L. Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology. 37 (8), 907-915 (2019).
Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature Biotechnology. 33 (3), 290-295 (2015).
Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
Dori, M., Caroli, J., Forcato, M. Circr, a computational tool to identify miRNA:circRNA associations. Frontiers in Bioinformatics. 2, 852834 (2022).
Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Research. 13 (11), 2498-2504 (2003).
Wu, T., et al. clusterProfiler 4.0: A universal enrichment tool for interpreting omics data. The Innovation. 2 (3), 100141 (2021).
Yu, G., Wang, L. G., Han, Y., He, Q. Y. clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS: A Journal of Integrative Biology. 16 (5), 284-287 (2012).
. org.Hs.eg.db: Genome wide annotation for human. 2022. R package version 3.15.0 Available from: https://bioconductor.org/packages/release/data/annotation/html/org.Hs.eg.db.html (2022)
Barrett, T., et al. NCBI GEO: archive for functional genomics data sets-update. Nucleic Acids Research. 41, 991-995 (2012).
Gao, Y., Zhang, J., Zhao, F. Circular RNA identification based on multiple seed matching. Briefings in Bioinformatics. 19 (5), 803-810 (2018).
Zhang, X. O., et al. Diverse alternative back-splicing and alternative splicing landscape of circular RNAs. Genome Research. 26 (9), 1277-1287 (2016).
Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
Wang, K., et al. MapSplice: Accurate mapping of RNA-seq reads for splice junction discovery. Nucleic Acids Research. 38 (18), 178 (2010).
Song, X., et al. Circular RNA profile in gliomas revealed by identification tool UROBORUS. Nucleic Acids Research. 44 (9), 87 (2016).
Hansen, T. B. Improved circRNA identification by combining prediction algorithms. Frontiers in Cell and Developmental Biology. 6, 20 (2018).
Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: A bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
Ma, X. K., et al. CIRCexplorer3: A CLEAR pipeline for direct comparison of circular and linear RNA expression. Genomics Proteomics Bioinformatics. 17 (5), 511-521 (2019).
Gaffo, E., Buratin, A., Dal Molin, A., Bortoluzzi, S. Sensitive, reliable and robust circRNA detection from RNA-seq with CirComPara2. Briefings in Bioinformatics. 23 (1), (2022).
Glažar, P., Papavasileiou, P., Rajewsky, N. circBase: a database for circular RNAs. RNA. 20 (11), 1666-1670 (2014).
Tan, S., et al. Circular RNA F-circEA-2a derived from EML4-ALK fusion gene promotes cell migration and invasion in non-small cell lung cancer. Molecular Cancer. 17 (1), 138 (2018).
Guarnerio, J., et al. Oncogenic role of Fusion-circRNAs Derived from cancer-associated chromosomal translocations. Cell. 165 (2), 289-302 (2016).
McGeary, S. E., et al. The biochemical basis of microRNA targeting efficacy. Science. 366 (6472), (2019).
Enright, A. J., et al. MicroRNA targets in Drosophila. Genome Biology. 5 (1), 1 (2003).
Rehmsmeier, M., Steffen, P., Hochsmann, M., Giegerich, R. Fast and effective prediction of microRNA/target duplexes. RNA. 10 (10), 1507-1517 (2004).
Zhang, D., et al. AllEnricher: a comprehensive gene set function enrichment tool for both model and non-model species. BMC Bioinformatics. 21 (1), 106 (2020).
Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10 (1), 1523 (2019).

Nachdrucke und Genehmigungen

Genehmigung beantragen, um den Text oder die Abbildungen dieses JoVE-Artikels zu verwenden

Genehmigung beantragen

In Silico Identifizierung und Charakterisierung von circRNAs während Wirt-Pathogen-Interaktionen

In diesem Artikel

Zusammenfassung

Zusammenfassung

Einleitung

Protokoll

Ergebnisse

Diskussion

Offenlegungen

Danksagungen

Materialien

Referenzen

Nachdrucke und Genehmigungen

Weitere Artikel entdecken