Accedi

È necessario avere un abbonamento a JoVE per visualizzare questo. Accedi o inizia la tua prova gratuita.

In questo articolo

  • Riepilogo
  • Abstract
  • Introduzione
  • Protocollo
  • Risultati
  • Discussione
  • Divulgazioni
  • Riconoscimenti
  • Materiali
  • Riferimenti
  • Ristampe e Autorizzazioni

Riepilogo

Il protocollo qui presentato spiega la pipeline completa in silico necessaria per prevedere e caratterizzare funzionalmente i circRNA dai dati del trascrittoma di sequenziamento dell'RNA che studiano le interazioni ospite-patogeno.

Abstract

Gli RNA circolari (circRNA) sono una classe di RNA non codificanti che si formano tramite back-splicing. Questi circRNA sono prevalentemente studiati per il loro ruolo di regolatori di vari processi biologici. In particolare, prove emergenti dimostrano che i circRNA dell'ospite possono essere espressi in modo differenziale (DE) dopo l'infezione da agenti patogeni (ad esempio, influenza e coronavirus), suggerendo un ruolo per i circRNA nella regolazione delle risposte immunitarie innate dell'ospite. Tuttavia, le indagini sul ruolo dei circRNA durante le infezioni patogene sono limitate dalle conoscenze e dalle competenze necessarie per effettuare le analisi bioinformatiche necessarie per identificare i circRNA DE dai dati di sequenziamento dell'RNA (RNA-seq). La previsione bioinformatica e l'identificazione dei circRNA è fondamentale prima di qualsiasi verifica e gli studi funzionali utilizzano tecniche di laboratorio umido costose e dispendiose in termini di tempo. Per risolvere questo problema, in questo manoscritto viene fornito un protocollo passo-passo di previsione in silico e caratterizzazione dei circRNA utilizzando i dati RNA-seq. Il protocollo può essere suddiviso in quattro fasi: 1) Predizione e quantificazione dei circRNA DE tramite la pipeline CIRIquant; 2) Annotazione tramite circBase e caratterizzazione di circRNA DE; 3) Predizione dell'interazione CircRNA-miRNA attraverso pipeline Circr; 4) analisi dell'arricchimento funzionale di geni parentali circRNA utilizzando Gene Ontology (GO) e Kyoto Encyclopedia of Genes and Genomes (KEGG). Questa pipeline sarà utile per guidare la futura ricerca in vitro e in vivo per svelare ulteriormente il ruolo dei circRNA nelle interazioni ospite-patogeno.

Introduzione

Le interazioni ospite-patogeno rappresentano una complessa interazione tra i patogeni e gli organismi ospiti, che innesca le risposte immunitarie innate degli ospiti che alla fine si traducono nella rimozione dei patogeni invasori 1,2. Durante le infezioni patogene, una moltitudine di geni immunitari dell'ospite è regolata per inibire la replicazione e il rilascio di agenti patogeni. Ad esempio, i geni comuni stimolati dall'interferone (ISG) regolati sulle infezioni patogene includono ADAR1, IFIT1, IFIT2, IFIT3, ISG20, RIG-I e OASL 3,4. Oltre ai geni codificanti proteine, gli studi hanno anche riportato che anche gli RNA non codificanti come gli RNA lunghi non codificanti (lncRNA), i microRNA (miRNA) e gli RNA circolari (circRNA) svolgono un ruolo e sono regolati contemporaneamente durante le infezioni patogene 5,6,7. A differenza dei geni codificanti proteine che codificano principalmente le proteine come molecole funzionali, gli RNA non codificanti (ncRNA) sono noti per funzionare come regolatori dei geni a livello trascrizionale e post-trascrizionale. Tuttavia, gli studi che coinvolgono la partecipazione di RNA non codificanti, in particolare circRNA, nella regolazione dei geni immunitari degli ospiti non sono ben riportati rispetto ai geni codificanti proteine.

I circRNA sono ampiamente caratterizzati dalla loro struttura ad anello continuo covalentemente chiusa, che viene generata attraverso un processo di splicing non canonico chiamato back-splicing8. Il processo di back-splicing, a differenza del processo di splicing di RNA lineari affini, comporta la legatura del sito donatore a valle al sito accettore a monte, formando una struttura di forma circolare. Attualmente sono stati proposti tre diversi meccanismi di back-splicing per la biogenesi dei circRNA. Si tratta della circolarizzazione mediata dalla proteina legante l'RNA (RBP) 9,10, della circolarizzazione guidata dall'intron-pairing 11 e della circolarizzazione guidata da lariat12,13,14. Dato che i circRNA sono collegati end-to-end in una struttura circolare, tendono ad essere naturalmente resistenti alle normali digestioni esonucleasi e, quindi, sono considerati più stabili delle loro controparti lineari15. Un'altra caratteristica comune esibita dai circRNA include l'espressione specifica del tipo di cellula o tessuto negli ospiti16.

Come implicato dalla loro struttura unica e dall'espressione specifica della cellula o del tessuto, è stato scoperto che i circRNA svolgono importanti funzioni biologiche nelle cellule. Ad oggi, una delle funzioni di spicco dei circRNA è il loro ruolo di spugne microRNA (miRNA)17,18. Questo ruolo regolatore dei circRNA avviene attraverso il legame complementare dei nucleotidi circRNA con la regione seme dei miRNA. Tale interazione circRNA-miRNA inibisce le normali funzioni regolatrici dei miRNA sugli mRNA bersaglio, regolando così l'espressione dei geni19,20. Inoltre, i circRNA sono anche noti per regolare l'espressione genica interagendo con le proteine leganti l'RNA (RBP) e formando complessi RNA-proteina21. Sebbene i circRNA siano classificati come RNA non codificanti, ci sono anche prove che i circRNA possono fungere da modelli per la traduzione proteica22,23,24.

Recentemente, è stato dimostrato che i circRNA svolgono un ruolo fondamentale nella regolazione delle interazioni ospite-patogeno, in particolare tra gli ospiti e i virus. Generalmente, si presume che i circRNA dell'ospite aiutino a regolare le risposte immunitarie dell'ospite per eliminare i patogeni invasori. Un esempio di circRNA che promuove le risposte immunitarie dell'ospite è circRNA_0082633, riportato da Guo et al.25. Questo circRNA migliora la segnalazione dell'interferone di tipo I (IFN) all'interno delle cellule A549, che aiuta a sopprimere la replicazione del virus dell'influenza25. Inoltre, Qu et al. hanno anche riportato un circRNA intronico umano, chiamato circRNA AIVR, che promuove l'immunità regolando l'espressione della proteina legante CREB (CREBBP), un trasduttore di segnale di IFN-β26,27. Tuttavia, esistono anche circRNA che sono noti per promuovere la patogenesi della malattia dopo l'infezione. Ad esempio, Yu et al. hanno recentemente riportato il ruolo svolto da un circRNA spliced dal dominio delle dita di zinco GATA contenente il gene 2A (circGATAD2A) nel promuovere la replicazione del virus H1N1 attraverso l'inibizione dell'autofagia28 della cellula ospite.

Per studiare efficacemente i circRNA, viene solitamente implementato un algoritmo di predizione del circRNA a livello di genoma, seguito da una caratterizzazione in silico dei candidati circRNA previsti prima che possano essere condotti studi funzionali. Tale approccio bioinformatico per prevedere e caratterizzare i circRNA è meno costoso e più efficiente in termini di tempo. Aiuta a perfezionare il numero di candidati da studiare funzionalmente e potrebbe potenzialmente portare a nuove scoperte. Qui, forniamo un protocollo dettagliato basato sulla bioinformatica per l'identificazione in silico , la caratterizzazione e l'annotazione funzionale dei circRNA durante le interazioni ospite-patogeno. Il protocollo include l'identificazione e la quantificazione di circRNA da set di dati di sequenziamento dell'RNA, l'annotazione tramite circBase e la caratterizzazione dei candidati circRNA in termini di tipi di circRNA, numero di geni sovrapposti e interazioni circRNA-miRNA previste. Questo studio fornisce anche l'annotazione funzionale dei geni parentali circRNA attraverso l'analisi dell'arricchimento di Gene Ontology (GO) e della Kyoto Encyclopedia of Genes and Genomes (KEGG).

Protocollo

In questo protocollo, i set di dati della libreria RNA-seq impoveriti di RNA ribosomiale (rRNA) de-identificati preparati dalle cellule macrofagiche umane infette da virus dell'influenza A sono stati scaricati e utilizzati dal database Gene Expression Omnibus (GEO). L'intera pipeline bioinformatica dalla predizione alla caratterizzazione funzionale dei circRNA è riassunta nella Figura 1. Ogni parte della pipeline è ulteriormente spiegata nelle sezioni seguenti.

1. Preparazione, download e configurazione prima dell'analisi dei dati

NOTA: tutti i pacchetti software utilizzati in questo studio sono gratuiti e open source.

  1. Download degli strumenti richiesti sulla piattaforma Linux
    1. Scaricare e installare il software e gli strumenti necessari elencati nella tabella dei materiali su un computer Linux ad alte prestazioni utilizzando le istruzioni fornite dallo sviluppatore.
      NOTA: la maggior parte degli strumenti e del software dispone di proprie pagine GitHub online o di documentazione contenente istruzioni sull'installazione e l'utilizzo degli strumenti (fare riferimento alla tabella dei materiali).
    2. Scarica i set di dati RNA-seq desiderati per il rilevamento e l'analisi dei circRNA dai siti Web di archivio delle sequenze (ad esempio, European Nucleotides Archive e Gene Expression Omnibus).
    3. Scaricare i genomi di riferimento (formato FASTA) e i file di annotazione (formato GTF/GFF3), compatibili con l'host da cui è stato preparato il dataset RNA-seq. I genomi di riferimento host e i file di annotazione si trovano solitamente sui browser del genoma online come il National Center for Biotechnology Information (NCBI), l'Università della California Santa Cruz (UCSC) e i siti Web Ensembl.
  2. Controllo qualità dell'RNA-seq
    1. Inserire i file FASTQ nel programma FASTQC per determinare la qualità delle sequenze di RNA. Se la qualità dei file FASTQ è bassa (ad esempio, 29,30.

2. Predizione e analisi dell'espressione differenziale di circRNA utilizzando CIRIquant

NOTA: Un manuale più dettagliato sull'installazione e l'esecuzione dell'analisi delle espressioni differenziali è disponibile nella sezione relativa alla disponibilità del codice del documento CIRIquant31. I dati supplementari includono anche alcuni dei comandi di base utilizzati in questo protocollo.

  1. Previsioni di CircRNA
    1. Indicizzare prima il genoma di riferimento dell'host utilizzando gli allineatori BWA e HISAT2. Quindi, su un terminale Linux, eseguire i comandi bwa index 32 e hisat2-build33 nella directory del genoma di riferimento dell'host per indicizzarlo.
    2. Quindi, preparare un file di configurazione YML contenente il nome del file, il percorso degli strumenti (BWA, HISAT2, stringtie34, samtools35), il percorso dei file di riferimento scaricati (file FASTA del genoma di riferimento dell'host, file di annotazione) e il percorso dei file di indice dal passaggio 2.1.1.
    3. Eseguire lo strumento CIRIquant dal terminale utilizzando i parametri predefiniti o manuali. L'utente può specificare il tipo di libreria (incagliata o non filata) dei dati RNA-seq durante l'esecuzione dello strumento CIRIquant.
      NOTA: Il tipo di libreria dei dati RNA-seq può essere determinato conoscendo il tipo di kit di preparazione della libreria utilizzato. Se l'identità del kit di preparazione della libreria è sconosciuta, un pacchetto bioinformatico di controllo RNA-seq chiamato RSeQC36 può essere utilizzato per determinare la filamento dei dati RNA-seq.
  2. Analisi dell'espressione differenziale
    NOTA: il pacchetto CIRIquant include prep_CIRIquant, prepDE.py e CIRI_DE_replicate; Pertanto, non sono necessari download aggiuntivi per questi tre strumenti.
    1. Preparare un file di testo (.lst) con un elenco di dati contenenti quanto segue:
      1acolonna: ID dei dati RNA-seq utilizzati nella fase 2.1.3
      2° colonna: percorso dei file GTF emessi da CIRIquant
      3° colonna: raggruppamento dei dati RNA-seq, sia che si tratti di un gruppo di controllo o trattato.
    2. Per un esempio, fare riferimento alla Tabella 1 riportata di seguito.
      NOTA: non è necessario inserire le intestazioni in quanto sono solo per riferimento.
    3. Sul terminale Linux, eseguire prep_CIRIquant con il file di testo (.lst) preparato nel passaggio 2.2.1 come input. L'esecuzione genererà un elenco di file: library_info.csv, circRNA_info.csv, circRNA_bsj.csv e circRNA_ratio.csv.
    4. Preparare un secondo file di testo con un elenco di dati contenenti gli ID RNA-seq e il percorso del rispettivo output StringTie. Il layout del file deve essere simile al file di testo nel passaggio 2.2.1 senza la colonna di raggruppamento.
    5. Eseguire prepDE.py con il file di testo preparato nel passaggio 2.2.4 come input per generare i file della matrice di conteggio dei geni.
    6. Eseguire CIRI_DE_replicate con i file library_info.csv e circRNA_bsj.csv del passaggio 2.2.3 e il file gene_count_matrix.csv del passaggio 2.2.5 come input per generare il file circRNA_de.tsv finale.
  3. Filtraggio dei circRNA DE
    1. Utilizzare R (nel terminale del computer o RStudio) o qualsiasi software per fogli di calcolo (ad esempio, Microsoft Excel) per aprire il file circRNA_de.tsv generato dal passaggio 2.2.6 per filtrare e determinare il numero di circRNA differenzialmente espressi (DE).
    2. Filtrare i circRNA DE secondo i criteri LogFC > |2| e FDR < 0,05.
    3. Creare un file denominato DE_circRNAs.txt per memorizzare le informazioni dei circRNA DE.

3. Caratterizzazione e annotazione dei circRNA DE previsti

  1. Stato di annotazione dei circRNA DE
    1. Caricare il file denominato DE_circRNAs.txt in RStudio , che consiste nell'elenco dei circRNA DE filtrati dal passaggio 2.3.3. Includere altre informazioni come le posizioni genomiche (Chr, Start, End), gli orientamenti dei filamenti (+ o -), il nome del gene e il tipo di circRNA. Prima di procedere, convertire le coordinate iniziali genomiche del circRNA da CIRIquant a 0 sottraendo 1 coppia di basi.
      NOTA: Le altre informazioni sopra indicate possono essere ottenute dai file GTF emessi da CIRIquant (file supplementare 1).
    2. Determinare lo stato di annotazione dei circRNA DE previsti scaricando una libreria contenente le posizioni genomiche dei circRNA depositati nel database circRNA (ad esempio, circBase).
      NOTA: Assicurarsi che la versione del genoma utilizzata per prevedere i circRNA sia identica alla libreria del database circRNA prima di effettuare il confronto. Il file di dati circBase utilizzato qui è liberamente disponibile nella cartella delle unità fornita in Github (https://github.com/bicciatolab/Circr)37.
    3. Una volta preparati entrambi i file del passaggio 3.1.1 e del passaggio 3.1.2, eseguire lo script R fornito nel file supplementare 1. Le posizioni cromosomiche dei circRNA DE vengono interrogate nella libreria prima di assegnare lo stato Annotated o Unannotated.
  2. Caratterizzazione dei circRNA DE
    1. Utilizzare R e altri software per fogli di calcolo per riassumere il numero di circRNA in base ai tipi di circRNA (cioè esone, introne, intergenico e antisenso) e il numero di geni che i circRNA attraversano (1 o >1) (file supplementare 1).NOTA: CIRIquant può rilevare solo quattro tipi di circRNA (esone, introne, intergenico e antisenso). I circRNA esone-introne, noti anche come ElciRNA, non possono essere rilevati da CIRIquant.

4. Prevedere l'interazione circRNA-miRNA usando Circr

NOTA: Un manuale più dettagliato su come installare e utilizzare Circr per l'analisi dell'interazione circRNA-miRNA può essere trovato all'indirizzo: https://github.com/bicciatolab/Circr37.

  1. Preparazione dei fascicoli
    1. Decomprimere ed estrarre il contenuto del file Circr.zip dopo averlo scaricato dalla pagina Circr GitHub utilizzando il software pertinente come "WinRar" o "7-zip" in una nuova directory in cui verrà condotta l'analisi.
    2. Installare le applicazioni software preliminari (miRanda, RNAhybrid, Pybedtools e samtools) prima di condurre l'analisi circRNA-miRNA.
    3. I genomi di riferimento e i file di annotazione per diversi organismi di interesse, il file di coordinate rRNA, il file di interazione miRNA convalidato e i file circRNA circBase sono forniti dall'autore Circr nella pagina Github (https://github.com/bicciatolab/Circr)37. Facendo clic sui file di supporto nella cartella dell'unità, selezionare la cartella per l'organismo di interesse, la cartella miRNA e il file di testo circBase e scaricarlo.
    4. Dopo aver scaricato i file necessari nel passaggio 4.1.3, creare una nuova directory denominata support_files nella directory menzionata al punto 4.1.1. Quindi, decomprimere ed estrarre il contenuto nella directory support_files .
    5. Indicizzare il file del genoma di riferimento dell'organismo di interesse utilizzando il comando samtools faidx (file supplementare 1).
    6. Preparare un file di input costituito dalle coordinate dei circRNA DE di interesse in un file BED delimitato da tabulazioni, come mostrato nella Tabella 2.
      NOTA: Poiché i circRNA previsti da CIRIquant non sono basati su 0, è necessario meno 1 bp alla coordinata iniziale (come menzionato nel passo 3.1.1) prima di convertirli nel formato BED. Le intestazioni mostrate nella Tabella 2 sono solo di riferimento e non sono necessarie nei file BED.
    7. A questo punto, assicurarsi che la struttura ad albero delle cartelle prevista per l'analisi Circr sia come nella Figura 2.
  2. Esecuzione Circr.py
    1. Eseguire Circr.py utilizzando Python 3 e, come argomenti, specificare il file di input circRNA, il genoma FASTA dell'organismo di interesse, la versione del genoma dell'organismo selezionato, il numero di thread e il nome del file di output nella riga di comando.
    2. Se l'organismo di interesse non è fornito nella cartella dell'unità elencata al punto 4.1.3 o se l'utente preferisce avere un set personalizzato di file per eseguire l'analisi, è necessario includere comandi aggiuntivi che specifichino la posizione di questi file durante l'esecuzione di Circr.py.
    3. Al termine dell'analisi Circr, il programma produce un file di interazione circRNA-miRNA nel formato csv.
    4. Filtrare i risultati dell'interazione circRNA-miRNA in base alle preferenze specifiche dell'utente. Per questo studio, le previsioni vengono filtrate utilizzando Rstudio in base ai seguenti criteri:
      -Rilevato da tutti e tre gli strumenti software
      -Due o più siti di legame segnalati sia da Targetscan che da miRanda
      -Identificato nelle colonne "AGO" o "validated"
      -Filtrare le interazioni della regione di semi
    5. Scrivere i circRNA che passano le condizioni filtrate dal passaggio 4.2.3 in un nuovo file di testo denominato circRNA_miRNA.txt. Tale filtraggio può aumentare la fiducia delle interazioni previste.

5. Costruzione della rete di ceRNA

NOTA: Un manuale dettagliato su come usare Cytoscape è disponibile all'indirizzo: http://manual.cytoscape.org/en/stable/ e https://github.com/cytoscape/cytoscape-tutorials/wiki#introduction

  1. Download e preparazione
    1. Scarica l'ultima versione di Cytoscape38 da: https://cytoscape.org/download.html.
    2. Eseguire la procedura guidata di installazione scaricata nel passaggio 5.1.1 e selezionare il percorso del file per il software Cytoscape.
    3. Preparare un file delimitato da tabulazioni contenente i circRNA di interesse e il loro miRNA bersaglio. La prima colonna è costituita dal nome del circRNA; la seconda colonna specifica il tipo di RNA dalla prima colonna; la terza colonna è il miRNA bersaglio; e la quarta colonna specifica il tipo di RNA dalla terza colonna. Un esempio del file è illustrato nella tabella 3.
  2. Costruzione della mappa della rete di ceRNA
    1. Aprire il software Cytoscape installato al punto 5.1.2.
    2. In Cytoscape, accedere a File > Importa > rete da file. Selezionare il file preparato al punto 5.1.3.
    3. Nella nuova scheda, selezionare la prima e la seconda colonna come "Nodo di origine" e "Attributo nodo di origine", mentre selezionare la terza e la quarta colonna rispettivamente come "Nodo di destinazione" e "Attributo nodo di destinazione". Fare clic su OK e la rete verrà visualizzata nella parte superiore destra di Cytoscape.
    4. Per modificare lo stile visivo della rete, premere il pulsante Stile sul lato sinistro di Cytoscape.
    5. Premere la freccia sul lato destro di Colore riempimento. Scegliere Tipo per la colonna e Mappatura discreta per il tipo di mappatura. Quindi, selezionare il colore desiderato per ciascuno dei tipi di RNA.
    6. Dopo aver modificato il colore, modificare la forma dei nodi passando a Forma e seguendo il passaggio 5.2.5.

6. Analisi dell'arricchimento funzionale

  1. Analisi di ontologia genica (GO) e Kyoto Encyclopedia of Genes and Genomes (KEGG) per il gene parentale dei circRNA
    1. Assicurarsi che clusterProfiler 39,40 e org. Hs.eg.db41 pacchetti sono stati installati in Rstudio. L'org. Il pacchetto Hs.eg.db41 è un pacchetto di annotazione a livello di genoma solo per gli esseri umani. Se l'organismo di interesse è un'altra specie, fare riferimento a: https://bioconductor.org/packages/release/BiocViews.html#OrgDb
    2. Importare le informazioni DE_circRNA dal punto 2.3.1 nell'area di lavoro di Rstudio.
    3. Utilizzare il gene parentale dei circRNA forniti in questo file per l'analisi dell'arricchimento nei prossimi passi. Tuttavia, se l'utente desidera convertire il simbolo del gene in altri formati, come l'ID Entrez, utilizzare una funzione come "bitr".
    4. Utilizzando l'ID del gene come input, eseguire l'analisi di arricchimento GO utilizzando la funzione enrichGO all'interno del pacchetto clusterProfiler39,40 utilizzando i parametri predefiniti.
    5. Utilizzando l'ID del gene come input, eseguire l'analisi di arricchimento KEGG utilizzando la funzione enrichKEGG all'interno del pacchetto clusterProfiler39,40 utilizzando i parametri predefiniti.

Risultati

Il protocollo arruolato nella sezione precedente è stato modificato e configurato per adattarsi al sistema operativo Linux. Il motivo principale è che la maggior parte delle librerie di moduli e dei pacchetti coinvolti nell'analisi dei circRNA possono funzionare solo sulla piattaforma Linux. In questa analisi, i set di dati della libreria RNA-seq impoveriti di RNA ribosomiale (rRNA) de-identificati preparati dalle cellule macrofagiche umane infette da virus dell'influenza A sono stati scaricati dal database GEO

Discussione

Per illustrare l'utilità di questo protocollo, è stato utilizzato come esempio RNA-seq da cellule macrofagiche umane infette da virus dell'influenza A. Sono stati studiati i circRNA che funzionano come potenziali spugne miRNA nelle interazioni ospite-patogeno e il loro arricchimento funzionale GO e KEGG all'interno di un ospite. Sebbene ci sia una varietà di strumenti circRNA disponibili online, ognuno di essi è un pacchetto autonomo che non interagisce tra loro. Qui, abbiamo messo insieme alcuni degli strumenti nece...

Divulgazioni

Gli autori non hanno nulla da rivelare.

Riconoscimenti

L'autore desidera ringraziare Tan Ke En e il Dr. Cameron Bracken per la loro recensione critica di questo manoscritto. Questo lavoro è stato sostenuto da sovvenzioni del Fundamental Research Grant Scheme (FRGS/1/2020/SKK0/UM/02/15) e dell'University of Malaya High Impact Research Grant (UM. C/625/1/HIR/MOE/CHAN/02/07).

Materiali

NameCompanyCatalog NumberComments
BedtoolsGitHubhttps://github.com/arq5x/bedtools2/Referring to section 4.1.2. Needed for Circr.
BWABurrows-Wheeler Alignerhttp://bio-bwa.sourceforge.net/Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
CircrGitHubhttps://github.com/bicciatolab/CircrReferring to section 4. Use to predict the miRNA binding sites
CIRIquantGitHubhttps://github.com/bioinfo-biols/CIRIquantReferring to section 2.1.3. To predict circRNAs
ClusterprofilerGitHubhttps://github.com/YuLab-SMU/clusterProfilerReferring to section 7. For GO and KEGG functional enrichment
CPUIntel Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz   Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000) Specifications used to run this entire protocol.
CytoscapeCytoscapehttps://cytoscape.org/download.htmlReferring to section 5.2. Needed to plot ceRNA network
FastQCBabraham Bioinformaticshttps://www.bioinformatics.babraham.ac.uk/projects/fastqc/Referring to section 1.2.1. Quality checking on Fastq files
HISAT2http://daehwankimlab.github.io/hisat2/Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
LinuxUbuntu 20.04.5 LTS (Focal Fossa)https://releases.ubuntu.com/focal/Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol.
miRandahttp://www.microrna.org/microrna/getDownloads.doReferring to section 4.1.2. Needed for Circr
Pybedtoolspybedtools 0.8.2https://pypi.org/project/pybedtools/Needed for BED file genomic manipulation
PythonPython 2.7 and 3.6 or aboverhttps://www.python.org/downloads/To run necessary library modules
RThe Comprehensive R Archive Networkhttps://cran.r-project.org/To manipulate dataframes
RNAhybridBiBiServhttps://bibiserv.cebitec.uni-bielefeld.de/rnahybridReferring to section 4.1.2. Needed for Circr
RStudioRStudiohttps://www.rstudio.com/A workspace to run R
samtools SAMtoolshttp://www.htslib.org/Referring to section 2.1.2. Needed to run CIRIquant
StringTieJohns Hopkins University: Center for Computational Biologyhttp://ccb.jhu.edu/software/stringtie/index.shtmlReferring to section 2.1.2. Needed to run CIRIquant
TargetScanGitHubhttps://github.com/nsoranzo/targetscanReferring to section 4.1.2. Needed for Circr

Riferimenti

  1. Raman, K., Bhat, A. G., Chandra, N. A systems perspective of host-pathogen interactions: predicting disease outcome in tuberculosis. Molecular BioSystems. 6 (3), 516-530 (2010).
  2. Casadevall, A., Pirofski, L. A. Host-pathogen interactions: basic concepts of microbial commensalism, colonization, infection, and disease. Infection and Immunity. 68 (12), 6511-6518 (2000).
  3. Yang, E., Li, M. M. H. All About the RNA: Interferon-stimulated genes that interfere with viral RNA processes. Frontiers in Immunology. 11, 605024 (2020).
  4. Schneider, W. M., Chevillotte, M. D., Rice, C. M. Interferon-stimulated genes: A complex web of host defenses. Annual Review of Immunology. 32 (1), 513-545 (2014).
  5. Shirahama, S., Miki, A., Kaburaki, T., Akimitsu, N. Long non-coding RNAs involved in pathogenic infection. Frontiers in Genetics. 11, 454 (2020).
  6. Chandan, K., Gupta, M., Sarwat, M. Role of host and pathogen-derived microRNAs in immune regulation during infectious and inflammatory diseases. Frontiers in Immunology. 10, 3081 (2019).
  7. Chen, X., et al. Circular RNAs in immune responses and immune diseases. Theranostics. 9 (2), 588-607 (2019).
  8. Kristensen, L. S., et al. The biogenesis, biology and characterization of circular RNAs. Nature Reviews Genetics. 20 (11), 675-691 (2019).
  9. Ashwal-Fluss, R., et al. circRNA biogenesis competes with pre-mRNA splicing. Molecular Cell. 56 (1), 55-66 (2014).
  10. Conn, S. J., et al. The RNA binding protein quaking regulates formation of circRNAs. Cell. 160 (6), 1125-1134 (2015).
  11. Zhang, X. O., et al. Complementary sequence-mediated exon circularization. Cell. 159 (1), 134-147 (2014).
  12. Robic, A., Demars, J., Kuhn, C. In-depth analysis reveals production of circular RNAs from non-coding sequences. Cells. 9 (8), 1806 (2020).
  13. Eger, N., Schoppe, L., Schuster, S., Laufs, U., Boeckel, J. N. Circular RNA splicing. Advances in Experimental Medicine and Biology. 1087, 41-52 (2018).
  14. Barrett, S. P., Wang, P. L., Salzman, J. Circular RNA biogenesis can proceed through an exon-containing lariat precursor. eLife. 4, 07540 (2015).
  15. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  16. Misir, S., Wu, N., Yang, B. B. Specific expression and functions of circular RNAs. Cell Death and Differentiation. 29 (3), 481-491 (2022).
  17. Bai, S., et al. Construct a circRNA/miRNA/mRNA regulatory network to explore potential pathogenesis and therapy options of clear cell renal cell carcinoma. Scientific Reports. 10 (1), 13659 (2020).
  18. Sakshi, S., Jayasuriya, R., Ganesan, K., Xu, B., Ramkumar, K. M. Role of circRNA-miRNA-mRNA interaction network in diabetes and its associated complications. Molecular Therapy - Nucleic Acids. 26, 1291-1302 (2021).
  19. Hansen, T. B., et al. miRNA-dependent gene silencing involving Ago2-mediated cleavage of a circular antisense RNA. The EMBO Journal. 30 (21), 4414-4422 (2011).
  20. Lu, M. Circular RNA: functions, applications, and prospects. ExRNA. 2 (1), 15 (2020).
  21. Liu, K. S., Pan, F., Mao, X. D., Liu, C., Chen, Y. J. Biological functions of circular RNAs and their roles in occurrence of reproduction and gynecological diseases. American Journal of Translational Research. 11 (1), 1-15 (2019).
  22. Pamudurti, N. R., et al. Translation of CircRNAs. Molecular Cell. 66 (1), 9-21 (2017).
  23. Legnini, I., et al. Circ-ZNF609 Is a circular RNA that can be translated and functions in myogenesis. Molecular Cell. 66 (1), 22-37 (2017).
  24. Weigelt, C. M., et al. An insulin-sensitive circular RNA that regulates lifespan in Drosophila. Molecular Cell. 79 (2), 268-279 (2020).
  25. Guo, Y., et al. Identification and characterization of circular RNAs in the A549 cells following Influenza A virus infection. Veterinary Microbiology. 267, 109390 (2022).
  26. Qu, Z., et al. A novel intronic circular RNA antagonizes influenza virus by absorbing a microRNA that degrades CREBBP and accelerating IFN-β production. mBio. 12 (4), 0101721 (2021).
  27. Kawarada, Y., et al. TGF-β induces p53/Smads complex formation in the PAI-1 promoter to activate transcription. Scientific Reports. 6 (1), 35483 (2016).
  28. Yu, T., et al. Circular RNA GATAD2A promotes H1N1 replication through inhibiting autophagy. Veterinary Microbiology. 231, 238-245 (2019).
  29. FastQC: A quality control tool for high throughput sequence data. Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010)
  30. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  31. Zhang, J., Chen, S., Yang, J., Zhao, F. Accurate quantification of circular RNAs identifies extensive circular isoform switching events. Nature Communications. 11 (1), 90 (2020).
  32. Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
  33. Kim, D., Paggi, J. M., Park, C., Bennett, C., Salzberg, S. L. Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology. 37 (8), 907-915 (2019).
  34. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature Biotechnology. 33 (3), 290-295 (2015).
  35. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  36. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  37. Dori, M., Caroli, J., Forcato, M. Circr, a computational tool to identify miRNA:circRNA associations. Frontiers in Bioinformatics. 2, 852834 (2022).
  38. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Research. 13 (11), 2498-2504 (2003).
  39. Wu, T., et al. clusterProfiler 4.0: A universal enrichment tool for interpreting omics data. The Innovation. 2 (3), 100141 (2021).
  40. Yu, G., Wang, L. G., Han, Y., He, Q. Y. clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS: A Journal of Integrative Biology. 16 (5), 284-287 (2012).
  41. . org.Hs.eg.db: Genome wide annotation for human. 2022. R package version 3.15.0 Available from: https://bioconductor.org/packages/release/data/annotation/html/org.Hs.eg.db.html (2022)
  42. Barrett, T., et al. NCBI GEO: archive for functional genomics data sets-update. Nucleic Acids Research. 41, 991-995 (2012).
  43. Gao, Y., Zhang, J., Zhao, F. Circular RNA identification based on multiple seed matching. Briefings in Bioinformatics. 19 (5), 803-810 (2018).
  44. Zhang, X. O., et al. Diverse alternative back-splicing and alternative splicing landscape of circular RNAs. Genome Research. 26 (9), 1277-1287 (2016).
  45. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  46. Wang, K., et al. MapSplice: Accurate mapping of RNA-seq reads for splice junction discovery. Nucleic Acids Research. 38 (18), 178 (2010).
  47. Song, X., et al. Circular RNA profile in gliomas revealed by identification tool UROBORUS. Nucleic Acids Research. 44 (9), 87 (2016).
  48. Hansen, T. B. Improved circRNA identification by combining prediction algorithms. Frontiers in Cell and Developmental Biology. 6, 20 (2018).
  49. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: A bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  50. Ma, X. K., et al. CIRCexplorer3: A CLEAR pipeline for direct comparison of circular and linear RNA expression. Genomics Proteomics Bioinformatics. 17 (5), 511-521 (2019).
  51. Gaffo, E., Buratin, A., Dal Molin, A., Bortoluzzi, S. Sensitive, reliable and robust circRNA detection from RNA-seq with CirComPara2. Briefings in Bioinformatics. 23 (1), (2022).
  52. Glažar, P., Papavasileiou, P., Rajewsky, N. circBase: a database for circular RNAs. RNA. 20 (11), 1666-1670 (2014).
  53. Tan, S., et al. Circular RNA F-circEA-2a derived from EML4-ALK fusion gene promotes cell migration and invasion in non-small cell lung cancer. Molecular Cancer. 17 (1), 138 (2018).
  54. Guarnerio, J., et al. Oncogenic role of Fusion-circRNAs Derived from cancer-associated chromosomal translocations. Cell. 165 (2), 289-302 (2016).
  55. McGeary, S. E., et al. The biochemical basis of microRNA targeting efficacy. Science. 366 (6472), (2019).
  56. Enright, A. J., et al. MicroRNA targets in Drosophila. Genome Biology. 5 (1), 1 (2003).
  57. Rehmsmeier, M., Steffen, P., Hochsmann, M., Giegerich, R. Fast and effective prediction of microRNA/target duplexes. RNA. 10 (10), 1507-1517 (2004).
  58. Zhang, D., et al. AllEnricher: a comprehensive gene set function enrichment tool for both model and non-model species. BMC Bioinformatics. 21 (1), 106 (2020).
  59. Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10 (1), 1523 (2019).

Ristampe e Autorizzazioni

Richiedi autorizzazione per utilizzare il testo o le figure di questo articolo JoVE

Richiedi Autorizzazione

Esplora altri articoli

Retrazionenumero 188RNA circolarecircRNAinterazione ospite patogeno

This article has been published

Video Coming Soon

JoVE Logo

Riservatezza

Condizioni di utilizzo

Politiche

Ricerca

Didattica

CHI SIAMO

Copyright © 2025 MyJoVE Corporation. Tutti i diritti riservati