È necessario avere un abbonamento a JoVE per visualizzare questo. Accedi o inizia la tua prova gratuita.
Il protocollo qui presentato spiega la pipeline completa in silico necessaria per prevedere e caratterizzare funzionalmente i circRNA dai dati del trascrittoma di sequenziamento dell'RNA che studiano le interazioni ospite-patogeno.
Gli RNA circolari (circRNA) sono una classe di RNA non codificanti che si formano tramite back-splicing. Questi circRNA sono prevalentemente studiati per il loro ruolo di regolatori di vari processi biologici. In particolare, prove emergenti dimostrano che i circRNA dell'ospite possono essere espressi in modo differenziale (DE) dopo l'infezione da agenti patogeni (ad esempio, influenza e coronavirus), suggerendo un ruolo per i circRNA nella regolazione delle risposte immunitarie innate dell'ospite. Tuttavia, le indagini sul ruolo dei circRNA durante le infezioni patogene sono limitate dalle conoscenze e dalle competenze necessarie per effettuare le analisi bioinformatiche necessarie per identificare i circRNA DE dai dati di sequenziamento dell'RNA (RNA-seq). La previsione bioinformatica e l'identificazione dei circRNA è fondamentale prima di qualsiasi verifica e gli studi funzionali utilizzano tecniche di laboratorio umido costose e dispendiose in termini di tempo. Per risolvere questo problema, in questo manoscritto viene fornito un protocollo passo-passo di previsione in silico e caratterizzazione dei circRNA utilizzando i dati RNA-seq. Il protocollo può essere suddiviso in quattro fasi: 1) Predizione e quantificazione dei circRNA DE tramite la pipeline CIRIquant; 2) Annotazione tramite circBase e caratterizzazione di circRNA DE; 3) Predizione dell'interazione CircRNA-miRNA attraverso pipeline Circr; 4) analisi dell'arricchimento funzionale di geni parentali circRNA utilizzando Gene Ontology (GO) e Kyoto Encyclopedia of Genes and Genomes (KEGG). Questa pipeline sarà utile per guidare la futura ricerca in vitro e in vivo per svelare ulteriormente il ruolo dei circRNA nelle interazioni ospite-patogeno.
Le interazioni ospite-patogeno rappresentano una complessa interazione tra i patogeni e gli organismi ospiti, che innesca le risposte immunitarie innate degli ospiti che alla fine si traducono nella rimozione dei patogeni invasori 1,2. Durante le infezioni patogene, una moltitudine di geni immunitari dell'ospite è regolata per inibire la replicazione e il rilascio di agenti patogeni. Ad esempio, i geni comuni stimolati dall'interferone (ISG) regolati sulle infezioni patogene includono ADAR1, IFIT1, IFIT2, IFIT3, ISG20, RIG-I e OASL 3,4. Oltre ai geni codificanti proteine, gli studi hanno anche riportato che anche gli RNA non codificanti come gli RNA lunghi non codificanti (lncRNA), i microRNA (miRNA) e gli RNA circolari (circRNA) svolgono un ruolo e sono regolati contemporaneamente durante le infezioni patogene 5,6,7. A differenza dei geni codificanti proteine che codificano principalmente le proteine come molecole funzionali, gli RNA non codificanti (ncRNA) sono noti per funzionare come regolatori dei geni a livello trascrizionale e post-trascrizionale. Tuttavia, gli studi che coinvolgono la partecipazione di RNA non codificanti, in particolare circRNA, nella regolazione dei geni immunitari degli ospiti non sono ben riportati rispetto ai geni codificanti proteine.
I circRNA sono ampiamente caratterizzati dalla loro struttura ad anello continuo covalentemente chiusa, che viene generata attraverso un processo di splicing non canonico chiamato back-splicing8. Il processo di back-splicing, a differenza del processo di splicing di RNA lineari affini, comporta la legatura del sito donatore a valle al sito accettore a monte, formando una struttura di forma circolare. Attualmente sono stati proposti tre diversi meccanismi di back-splicing per la biogenesi dei circRNA. Si tratta della circolarizzazione mediata dalla proteina legante l'RNA (RBP) 9,10, della circolarizzazione guidata dall'intron-pairing 11 e della circolarizzazione guidata da lariat12,13,14. Dato che i circRNA sono collegati end-to-end in una struttura circolare, tendono ad essere naturalmente resistenti alle normali digestioni esonucleasi e, quindi, sono considerati più stabili delle loro controparti lineari15. Un'altra caratteristica comune esibita dai circRNA include l'espressione specifica del tipo di cellula o tessuto negli ospiti16.
Come implicato dalla loro struttura unica e dall'espressione specifica della cellula o del tessuto, è stato scoperto che i circRNA svolgono importanti funzioni biologiche nelle cellule. Ad oggi, una delle funzioni di spicco dei circRNA è il loro ruolo di spugne microRNA (miRNA)17,18. Questo ruolo regolatore dei circRNA avviene attraverso il legame complementare dei nucleotidi circRNA con la regione seme dei miRNA. Tale interazione circRNA-miRNA inibisce le normali funzioni regolatrici dei miRNA sugli mRNA bersaglio, regolando così l'espressione dei geni19,20. Inoltre, i circRNA sono anche noti per regolare l'espressione genica interagendo con le proteine leganti l'RNA (RBP) e formando complessi RNA-proteina21. Sebbene i circRNA siano classificati come RNA non codificanti, ci sono anche prove che i circRNA possono fungere da modelli per la traduzione proteica22,23,24.
Recentemente, è stato dimostrato che i circRNA svolgono un ruolo fondamentale nella regolazione delle interazioni ospite-patogeno, in particolare tra gli ospiti e i virus. Generalmente, si presume che i circRNA dell'ospite aiutino a regolare le risposte immunitarie dell'ospite per eliminare i patogeni invasori. Un esempio di circRNA che promuove le risposte immunitarie dell'ospite è circRNA_0082633, riportato da Guo et al.25. Questo circRNA migliora la segnalazione dell'interferone di tipo I (IFN) all'interno delle cellule A549, che aiuta a sopprimere la replicazione del virus dell'influenza25. Inoltre, Qu et al. hanno anche riportato un circRNA intronico umano, chiamato circRNA AIVR, che promuove l'immunità regolando l'espressione della proteina legante CREB (CREBBP), un trasduttore di segnale di IFN-β26,27. Tuttavia, esistono anche circRNA che sono noti per promuovere la patogenesi della malattia dopo l'infezione. Ad esempio, Yu et al. hanno recentemente riportato il ruolo svolto da un circRNA spliced dal dominio delle dita di zinco GATA contenente il gene 2A (circGATAD2A) nel promuovere la replicazione del virus H1N1 attraverso l'inibizione dell'autofagia28 della cellula ospite.
Per studiare efficacemente i circRNA, viene solitamente implementato un algoritmo di predizione del circRNA a livello di genoma, seguito da una caratterizzazione in silico dei candidati circRNA previsti prima che possano essere condotti studi funzionali. Tale approccio bioinformatico per prevedere e caratterizzare i circRNA è meno costoso e più efficiente in termini di tempo. Aiuta a perfezionare il numero di candidati da studiare funzionalmente e potrebbe potenzialmente portare a nuove scoperte. Qui, forniamo un protocollo dettagliato basato sulla bioinformatica per l'identificazione in silico , la caratterizzazione e l'annotazione funzionale dei circRNA durante le interazioni ospite-patogeno. Il protocollo include l'identificazione e la quantificazione di circRNA da set di dati di sequenziamento dell'RNA, l'annotazione tramite circBase e la caratterizzazione dei candidati circRNA in termini di tipi di circRNA, numero di geni sovrapposti e interazioni circRNA-miRNA previste. Questo studio fornisce anche l'annotazione funzionale dei geni parentali circRNA attraverso l'analisi dell'arricchimento di Gene Ontology (GO) e della Kyoto Encyclopedia of Genes and Genomes (KEGG).
In questo protocollo, i set di dati della libreria RNA-seq impoveriti di RNA ribosomiale (rRNA) de-identificati preparati dalle cellule macrofagiche umane infette da virus dell'influenza A sono stati scaricati e utilizzati dal database Gene Expression Omnibus (GEO). L'intera pipeline bioinformatica dalla predizione alla caratterizzazione funzionale dei circRNA è riassunta nella Figura 1. Ogni parte della pipeline è ulteriormente spiegata nelle sezioni seguenti.
1. Preparazione, download e configurazione prima dell'analisi dei dati
NOTA: tutti i pacchetti software utilizzati in questo studio sono gratuiti e open source.
2. Predizione e analisi dell'espressione differenziale di circRNA utilizzando CIRIquant
NOTA: Un manuale più dettagliato sull'installazione e l'esecuzione dell'analisi delle espressioni differenziali è disponibile nella sezione relativa alla disponibilità del codice del documento CIRIquant31. I dati supplementari includono anche alcuni dei comandi di base utilizzati in questo protocollo.
3. Caratterizzazione e annotazione dei circRNA DE previsti
4. Prevedere l'interazione circRNA-miRNA usando Circr
NOTA: Un manuale più dettagliato su come installare e utilizzare Circr per l'analisi dell'interazione circRNA-miRNA può essere trovato all'indirizzo: https://github.com/bicciatolab/Circr37.
5. Costruzione della rete di ceRNA
NOTA: Un manuale dettagliato su come usare Cytoscape è disponibile all'indirizzo: http://manual.cytoscape.org/en/stable/ e https://github.com/cytoscape/cytoscape-tutorials/wiki#introduction
6. Analisi dell'arricchimento funzionale
Il protocollo arruolato nella sezione precedente è stato modificato e configurato per adattarsi al sistema operativo Linux. Il motivo principale è che la maggior parte delle librerie di moduli e dei pacchetti coinvolti nell'analisi dei circRNA possono funzionare solo sulla piattaforma Linux. In questa analisi, i set di dati della libreria RNA-seq impoveriti di RNA ribosomiale (rRNA) de-identificati preparati dalle cellule macrofagiche umane infette da virus dell'influenza A sono stati scaricati dal database GEO
Per illustrare l'utilità di questo protocollo, è stato utilizzato come esempio RNA-seq da cellule macrofagiche umane infette da virus dell'influenza A. Sono stati studiati i circRNA che funzionano come potenziali spugne miRNA nelle interazioni ospite-patogeno e il loro arricchimento funzionale GO e KEGG all'interno di un ospite. Sebbene ci sia una varietà di strumenti circRNA disponibili online, ognuno di essi è un pacchetto autonomo che non interagisce tra loro. Qui, abbiamo messo insieme alcuni degli strumenti nece...
Gli autori non hanno nulla da rivelare.
L'autore desidera ringraziare Tan Ke En e il Dr. Cameron Bracken per la loro recensione critica di questo manoscritto. Questo lavoro è stato sostenuto da sovvenzioni del Fundamental Research Grant Scheme (FRGS/1/2020/SKK0/UM/02/15) e dell'University of Malaya High Impact Research Grant (UM. C/625/1/HIR/MOE/CHAN/02/07).
Name | Company | Catalog Number | Comments |
Bedtools | GitHub | https://github.com/arq5x/bedtools2/ | Referring to section 4.1.2. Needed for Circr. |
BWA | Burrows-Wheeler Aligner | http://bio-bwa.sourceforge.net/ | Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome |
Circr | GitHub | https://github.com/bicciatolab/Circr | Referring to section 4. Use to predict the miRNA binding sites |
CIRIquant | GitHub | https://github.com/bioinfo-biols/CIRIquant | Referring to section 2.1.3. To predict circRNAs |
Clusterprofiler | GitHub | https://github.com/YuLab-SMU/clusterProfiler | Referring to section 7. For GO and KEGG functional enrichment |
CPU | Intel | Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000) | Specifications used to run this entire protocol. |
Cytoscape | Cytoscape | https://cytoscape.org/download.html | Referring to section 5.2. Needed to plot ceRNA network |
FastQC | Babraham Bioinformatics | https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ | Referring to section 1.2.1. Quality checking on Fastq files |
HISAT2 | http://daehwankimlab.github.io/hisat2/ | Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome | |
Linux | Ubuntu 20.04.5 LTS (Focal Fossa) | https://releases.ubuntu.com/focal/ | Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol. |
miRanda | http://www.microrna.org/microrna/getDownloads.do | Referring to section 4.1.2. Needed for Circr | |
Pybedtools | pybedtools 0.8.2 | https://pypi.org/project/pybedtools/ | Needed for BED file genomic manipulation |
Python | Python 2.7 and 3.6 or abover | https://www.python.org/downloads/ | To run necessary library modules |
R | The Comprehensive R Archive Network | https://cran.r-project.org/ | To manipulate dataframes |
RNAhybrid | BiBiServ | https://bibiserv.cebitec.uni-bielefeld.de/rnahybrid | Referring to section 4.1.2. Needed for Circr |
RStudio | RStudio | https://www.rstudio.com/ | A workspace to run R |
samtools | SAMtools | http://www.htslib.org/ | Referring to section 2.1.2. Needed to run CIRIquant |
StringTie | Johns Hopkins University: Center for Computational Biology | http://ccb.jhu.edu/software/stringtie/index.shtml | Referring to section 2.1.2. Needed to run CIRIquant |
TargetScan | GitHub | https://github.com/nsoranzo/targetscan | Referring to section 4.1.2. Needed for Circr |
Richiedi autorizzazione per utilizzare il testo o le figure di questo articolo JoVE
Richiedi AutorizzazioneEsplora altri articoli
This article has been published
Video Coming Soon