Zum Anzeigen dieser Inhalte ist ein JoVE-Abonnement erforderlich. Melden Sie sich an oder starten Sie Ihre kostenlose Testversion.
Method Article
Das hier eingereichte Protokoll erläutert die vollständige In-silico-Pipeline , die für die Vorhersage und funktionelle Charakterisierung von circRNAs aus RNA-Sequenzierungs-Transkriptomdaten zur Untersuchung von Wirt-Pathogen-Interaktionen erforderlich ist.
Zirkuläre RNAs (circRNAs) sind eine Klasse nicht-kodierender RNAs, die durch Back-Sppleißen gebildet werden. Diese circRNAs werden vor allem auf ihre Rolle als Regulatoren verschiedener biologischer Prozesse untersucht. Bemerkenswert ist, dass neue Erkenntnisse zeigen, dass Wirts-circRNAs bei einer Infektion mit Krankheitserregern (z. B. Influenza und Coronaviren) differentiell exprimiert werden können, was auf eine Rolle von circRNAs bei der Regulierung der angeborenen Immunantwort des Wirts hindeutet. Untersuchungen zur Rolle von circRNAs bei pathogenen Infektionen sind jedoch begrenzt durch die Kenntnisse und Fähigkeiten, die erforderlich sind, um die notwendigen bioinformatischen Analysen durchzuführen, um DE-circRNAs aus RNA-Sequenzierungsdaten (RNA-seq) zu identifizieren. Die bioinformatische Vorhersage und Identifizierung von circRNAs ist von entscheidender Bedeutung vor jeder Verifizierung und funktionellen Studien mit kostspieligen und zeitaufwändigen Nasslabortechniken. Um dieses Problem zu lösen, wird in diesem Manuskript ein Schritt-für-Schritt-Protokoll zur In-silico-Vorhersage und Charakterisierung von circRNAs unter Verwendung von RNA-seq-Daten bereitgestellt. Das Protokoll kann in vier Schritte unterteilt werden: 1) Vorhersage und Quantifizierung von DE-circRNAs über die CIRIquant-Pipeline; 2) Annotation mittels circBase und Charakterisierung von DE circRNAs; 3) Vorhersage der CircRNA-miRNA-Interaktion durch die Circr-Pipeline; 4) Analyse der funktionellen Anreicherung von circRNA-Elterngenen unter Verwendung von Gene Ontology (GO) und Kyoto Encyclopedia of Genes and Genomes (KEGG). Diese Pipeline wird nützlich sein, um die zukünftige In-vitro - und In-vivo-Forschung voranzutreiben, um die Rolle von circRNAs bei Wirt-Pathogen-Interaktionen weiter zu entschlüsseln.
Wirt-Pathogen-Interaktionen stellen ein komplexes Zusammenspiel zwischen den Krankheitserregern und den Wirtsorganismen dar, das die angeborenen Immunantworten des Wirts auslöst, die schließlich zur Entfernung eindringender Krankheitserreger führen 1,2. Bei pathogenen Infektionen wird eine Vielzahl der Immungene des Wirts reguliert, um die Vermehrung und Freisetzung von Krankheitserregern zu hemmen. Zu den häufigen Interferon-stimulierten Genen (ISGs), die bei pathogenen Infektionen reguliert werden, gehören ADAR1, IFIT1, IFIT2, IFIT3, ISG20, RIG-I und OASL 3,4. Studien haben gezeigt, dass neben proteinkodierenden Genen auch nicht-kodierende RNAs wie lange nicht-kodierende RNAs (lncRNAs), microRNAs (miRNAs) und zirkuläre RNAs (circRNAs) eine Rolle spielen und gleichzeitig bei pathogenen Infektionen reguliert werden 5,6,7. Im Gegensatz zu proteinkodierenden Genen, die Proteine hauptsächlich als funktionelle Moleküle kodieren, sind nicht-kodierende RNAs (ncRNAs) als Regulatoren von Genen auf transkriptioneller und posttranskriptioneller Ebene bekannt. Allerdings sind Studien, in denen nicht-kodierende RNAs, insbesondere circRNAs, an der Regulation der Immungene des Wirts beteiligt sind, im Vergleich zu den proteinkodierenden Genen nicht gut berichtet.
CircRNAs zeichnen sich weitgehend durch ihre kovalent geschlossene Endlosschleifenstruktur aus, die durch einen nicht-kanonischen Spleißprozess namens Back-Spleißen8 erzeugt wird. Im Gegensatz zum Spleißen verwandter linearer RNAs wird beim Back-Splicing die nachgeschaltete Donorstelle an die stromaufwärts gelegene Akzeptorstelle ligiert, wodurch eine kreisförmige Struktur entsteht. Derzeit werden drei verschiedene Back-Spleiß-Mechanismen für die Biogenese von circRNAs vorgeschlagen. Dabei handelt es sich um RNA-bindende Proteine (RBP)-vermittelte Zirkularisierung 9,10, Intron-Paarungs-getriebene Zirkularisierung 11 und Lariat-getriebene Zirkularisierung12,13,14. Da circRNAs in einer kreisförmigen Struktur Ende-zu-Ende verbunden sind, neigen sie dazu, von Natur aus resistent gegen normale Exonuklease-Verdauungen zu sein und gelten daher als stabiler als ihre linearen Gegenstücke15. Ein weiteres gemeinsames Merkmal von circRNAs ist die zell- oder gewebetypspezifische Expression in Wirten16.
Wie ihre einzigartige Struktur und ihre zell- oder gewebespezifische Expression vermuten lassen, haben circRNAs wichtige biologische Funktionen in Zellen übernommen. Bis heute ist eine der herausragenden Funktionen von circRNAs ihre Rolle als microRNA (miRNA)-Schwämme17,18. Diese regulatorische Rolle von circRNAs erfolgt durch die komplementäre Bindung von circRNA-Nukleotiden an die Seed-Region von miRNAs. Eine solche circRNA-miRNA-Interaktion hemmt die normalen regulatorischen Funktionen der miRNAs auf den Ziel-mRNAs und reguliert so die Expression der Gene19,20. Darüber hinaus ist bekannt, dass circRNAs die Genexpression regulieren, indem sie mit RNA-bindenden Proteinen (RBPs) interagieren und RNA-Protein-Komplexe bilden21. Obwohl circRNAs als nicht-kodierende RNAs klassifiziert werden, gibt es auch Hinweise darauf, dass circRNAs als Vorlagen für die Proteintranslation fungieren können22,23,24.
In jüngster Zeit wurde gezeigt, dass circRNAs eine zentrale Rolle bei der Regulierung der Wirt-Pathogen-Interaktionen spielen, insbesondere zwischen Wirt und Viren. Im Allgemeinen wird angenommen, dass Wirts-circRNAs bei der Regulierung der Immunantwort des Wirts helfen, um die eindringenden Krankheitserreger zu eliminieren. Ein Beispiel für circRNA, die die Immunantwort des Wirts fördert, ist circRNA_0082633, berichtet von Guo et al.25. Diese circRNA verstärkt die Signalübertragung von Typ-I-Interferon (IFN) in A549-Zellen, was dazu beiträgt, die Replikation von Influenzaviren zu unterdrücken25. Darüber hinaus berichteten Qu et al. auch über eine humane intronische circRNA, genannt circRNA AIVR, die die Immunität fördert, indem sie die Expression des CREB-bindenden Proteins (CREBBP), einem Signalwandler von IFN-βreguliert 26,27. Es gibt jedoch auch circRNAs, von denen bekannt ist, dass sie die Pathogenese von Krankheiten bei einer Infektion fördern. So berichteten Yu et al. kürzlich über die Rolle einer circRNA, die aus der GATA-Zinkfingerdomäne gespleißt wird, die das 2A-Gen (circGATAD2A) enthält, bei der Förderung der Replikation des H1N1-Virus durch die Hemmung der Autophagie der Wirtszelle28.
Um circRNAs effektiv untersuchen zu können, wird in der Regel ein genomweiter circRNA-Vorhersagealgorithmus implementiert, gefolgt von einer In-silico-Charakterisierung der vorhergesagten circRNA-Kandidaten, bevor funktionelle Studien durchgeführt werden können. Ein solcher bioinformatischer Ansatz zur Vorhersage und Charakterisierung von circRNAs ist kostengünstiger und zeiteffizienter. Es hilft, die Anzahl der Kandidaten zu verfeinern, die funktionell untersucht werden sollen, und könnte möglicherweise zu neuen Erkenntnissen führen. In dieser Arbeit stellen wir ein detailliertes bioinformatisches Protokoll für die in silico Identifizierung, Charakterisierung und funktionelle Annotation von circRNAs während der Wirt-Pathogen-Interaktionen zur Verfügung. Das Protokoll umfasst die Identifizierung und Quantifizierung von circRNAs aus RNA-Sequenzierungsdatensätzen, die Annotation über circBase und die Charakterisierung der circRNA-Kandidaten in Bezug auf circRNA-Typen, Anzahl überlappender Gene und vorhergesagte circRNA-miRNA-Interaktionen. Diese Studie liefert auch die funktionelle Annotation der circRNA-Elterngene durch Genontologie (GO) und die Anreicherungsanalyse der Kyoto Encyclopedia of Genes and Genomes (KEGG).
In diesem Protokoll wurden de-identifizierte ribosomale RNA (rRNA)-depletierte RNA-seq-Bibliotheksdatensätze, die aus den mit dem Influenza-A-Virus infizierten menschlichen Makrophagenzellen erstellt wurden, aus der Gene Expression Omnibus (GEO)-Datenbank heruntergeladen und verwendet. Die gesamte bioinformatische Pipeline von der Vorhersage bis zur funktionellen Charakterisierung von circRNAs ist in Abbildung 1 zusammengefasst. Jeder Teil der Pipeline wird in den folgenden Abschnitten näher erläutert.
1. Vorbereitung, Download und Einrichtung vor der Datenanalyse
HINWEIS: Alle in dieser Studie verwendeten Softwarepakete sind kostenlos und quelloffen.
2. Vorhersage und differentielle Expressionsanalyse von circRNAs mit CIRIquant
HINWEIS: Ein ausführlicheres Handbuch zur Installation und Durchführung der Differentialexpressionsanalyse finden Sie im Abschnitt Codeverfügbarkeit des CIRIquant-Papiers31. Die ergänzenden Daten enthalten auch einige der grundlegenden Befehle, die in diesem Protokoll verwendet werden.
3. Charakterisierung und Annotation von vorhergesagten DE-circRNAs
4. Vorhersage der circRNA-miRNA-Interaktion mit Circr
HINWEIS: Eine ausführlichere Anleitung zur Installation und Verwendung von Circr für die circRNA-miRNA-Interaktionsanalyse finden Sie unter: https://github.com/bicciatolab/Circr37.
5. Aufbau des ceRNA-Netzwerks
HINWEIS: Eine ausführliche Anleitung zur Verwendung von Cytoscape finden Sie unter: http://manual.cytoscape.org/en/stable/ und https://github.com/cytoscape/cytoscape-tutorials/wiki#introduction
6. Analyse der funktionalen Anreicherung
Das im vorherigen Abschnitt aufgeführte Protokoll wurde modifiziert und konfiguriert, um dem Linux-Betriebssystem gerecht zu werden. Der Hauptgrund dafür ist, dass die meisten Modulbibliotheken und Pakete, die an der Analyse von circRNAs beteiligt sind, nur auf der Linux-Plattform funktionieren können. In dieser Analyse wurden de-identifizierte ribosomale RNA (rRNA)-depletierte RNA-seq-Bibliotheksdatensätze, die aus den mit dem Influenza-A-Virus infizierten menschlichen Makrophagenzellen hergestellt wurden, aus der G...
Um den Nutzen dieses Protokolls zu veranschaulichen, wurde RNA-seq aus mit dem Influenza-A-Virus infizierten humanen Makrophagenzellen als Beispiel verwendet. CircRNAs, die als potentielle miRNA-Schwämme in Wirt-Pathogen-Interaktionen fungieren, und ihre GO- und KEGG-funktionelle Anreicherung innerhalb eines Wirts wurden untersucht. Obwohl es eine Vielzahl von circRNA-Tools gibt, die online verfügbar sind, ist jedes von ihnen ein eigenständiges Paket, das nicht miteinander interagiert. Hier stellen wir einige der Werk...
Die Autoren haben nichts zu verraten.
Der Autor dankt Tan Ke En und Dr. Cameron Bracken für die kritische Durchsicht dieses Manuskripts. Diese Arbeit wurde durch Zuschüsse aus dem Fundamental Research Grant Scheme (FRGS/1/2020/SKK0/UM/02/15) und dem University of Malaya High Impact Research Grant (UM. C/625/1/HIR/MOE/CHAN/02/07).
Name | Company | Catalog Number | Comments |
Bedtools | GitHub | https://github.com/arq5x/bedtools2/ | Referring to section 4.1.2. Needed for Circr. |
BWA | Burrows-Wheeler Aligner | http://bio-bwa.sourceforge.net/ | Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome |
Circr | GitHub | https://github.com/bicciatolab/Circr | Referring to section 4. Use to predict the miRNA binding sites |
CIRIquant | GitHub | https://github.com/bioinfo-biols/CIRIquant | Referring to section 2.1.3. To predict circRNAs |
Clusterprofiler | GitHub | https://github.com/YuLab-SMU/clusterProfiler | Referring to section 7. For GO and KEGG functional enrichment |
CPU | Intel | Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000) | Specifications used to run this entire protocol. |
Cytoscape | Cytoscape | https://cytoscape.org/download.html | Referring to section 5.2. Needed to plot ceRNA network |
FastQC | Babraham Bioinformatics | https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ | Referring to section 1.2.1. Quality checking on Fastq files |
HISAT2 | http://daehwankimlab.github.io/hisat2/ | Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome | |
Linux | Ubuntu 20.04.5 LTS (Focal Fossa) | https://releases.ubuntu.com/focal/ | Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol. |
miRanda | http://www.microrna.org/microrna/getDownloads.do | Referring to section 4.1.2. Needed for Circr | |
Pybedtools | pybedtools 0.8.2 | https://pypi.org/project/pybedtools/ | Needed for BED file genomic manipulation |
Python | Python 2.7 and 3.6 or abover | https://www.python.org/downloads/ | To run necessary library modules |
R | The Comprehensive R Archive Network | https://cran.r-project.org/ | To manipulate dataframes |
RNAhybrid | BiBiServ | https://bibiserv.cebitec.uni-bielefeld.de/rnahybrid | Referring to section 4.1.2. Needed for Circr |
RStudio | RStudio | https://www.rstudio.com/ | A workspace to run R |
samtools | SAMtools | http://www.htslib.org/ | Referring to section 2.1.2. Needed to run CIRIquant |
StringTie | Johns Hopkins University: Center for Computational Biology | http://ccb.jhu.edu/software/stringtie/index.shtml | Referring to section 2.1.2. Needed to run CIRIquant |
TargetScan | GitHub | https://github.com/nsoranzo/targetscan | Referring to section 4.1.2. Needed for Circr |
Genehmigung beantragen, um den Text oder die Abbildungen dieses JoVE-Artikels zu verwenden
Genehmigung beantragenThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Alle Rechte vorbehalten