É necessária uma assinatura da JoVE para visualizar este conteúdo. Faça login ou comece sua avaliação gratuita.
O protocolo apresentado aqui explica o pipeline in silico completo necessário para prever e caracterizar funcionalmente circRNAs a partir de dados de transcriptoma de sequenciamento de RNA estudando interações patógeno-hospedeiro.
RNAs circulares (circRNAs) são uma classe de RNAs não-codificantes que são formados via back-splicing. Estes circRNAs são predominantemente estudados por seus papéis como reguladores de vários processos biológicos. Notavelmente, evidências emergentes demonstram que circRNAs do hospedeiro podem ser diferencialmente expressos (DE) após a infecção por patógenos (por exemplo, influenza e coronavírus), sugerindo um papel para circRNAs na regulação das respostas imunes inatas do hospedeiro. No entanto, as investigações sobre o papel dos circRNAs durante infecções patogênicas são limitadas pelo conhecimento e habilidades necessárias para realizar a análise bioinformática necessária para identificar circRNAs DE a partir de dados de sequenciamento de RNA (RNA-seq). A predição bioinformática e a identificação de circRNAs são cruciais antes de qualquer verificação, e estudos funcionais usando técnicas de laboratório úmido caras e demoradas. Para resolver essa questão, um protocolo passo-a-passo de predição e caracterização in silico de circRNAs usando dados de RNA-seq é fornecido neste manuscrito. O protocolo pode ser dividido em quatro etapas: 1) Predição e quantificação de circRNAs DE via pipeline CIRIquant; 2) Anotação via circBase e caracterização de circRNAs DE; 3) Predição da interação CircRNA-miRNA através do pipeline Circr; 4) análise de enriquecimento funcional de genes parentais de circRNA usando Ontologia Gênica (GO) e Enciclopédia de Genes e Genomas de Kyoto (KEGG). Este pipeline será útil na condução de futuras pesquisas in vitro e in vivo para desvendar ainda mais o papel dos circRNAs nas interações patógeno-hospedeiro.
As interações patógeno-hospedeiro representam uma complexa interação entre os patógenos e os organismos hospedeiros, que desencadeia as respostas imunes inatas dos hospedeiros que, eventualmente, resultam na remoção de patógenos invasores 1,2. Durante infecções patogênicas, uma infinidade de genes imunes do hospedeiro é regulada para inibir a replicação e liberação de patógenos. Por exemplo, genes comuns estimulados por interferon (ISGs) regulados sobre infecções patogênicas incluem ADAR1, IFIT1, IFIT2, IFIT3, ISG20, RIG-I e OASL 3,4. Além dos genes codificadores de proteínas, estudos também relataram que RNAs não codificantes, como RNAs longos não codificadores (lncRNAs), microRNAs (miRNAs) e circulares (circRNAs), também desempenham um papel e são regulados concomitantemente durante infecções patogênicas 5,6,7. Em contraste com os genes codificadores de proteínas que codificam principalmente proteínas como moléculas funcionais, RNAs não-codificantes (ncRNAs) são conhecidos por funcionar como reguladores de genes em níveis transcricionais e pós-transcricionais. No entanto, estudos envolvendo a participação de RNAs não-codificantes, particularmente circRNAs, na regulação dos genes imunes dos hospedeiros não são bem relatados em comparação com os genes codificadores de proteínas.
Os circRNAs são amplamente caracterizados por sua estrutura de loop contínuo covalentemente fechado, que é gerado através de um processo de splicing não-canônico chamado back-splicing8. O processo de back-splicing, ao contrário do processo de splicing de RNAs lineares cognatos, envolve a ligadura do sítio doador a jusante ao sítio receptor a montante, formando uma estrutura de forma circular. Atualmente, três diferentes mecanismos de back-splicing para a biogênese de circRNAs têm sido propostos. Estas são a circularização mediada por RNA binding protein (RBP) 9,10, a circularização conduzida por intron-pairing 11 e a circularização conduzida por lariat12,13,14. Dado que os circRNAs estão conectados de ponta a ponta em uma estrutura circular, eles tendem a ser naturalmente resistentes às digestãos normais de exonucleases e, portanto, são considerados mais estáveis do que seus equivalentes lineares15. Outra característica comum exibida pelos circRNAs inclui a expressão específica do tipo celular ou tecidual em hospedeiros16.
Como implicado por sua estrutura única e expressão célula ou tecido-específica, circRNAs foram descobertos para desempenhar funções biológicas importantes nas células. Até o momento, uma das funções proeminentes dos circRNAs é seu papel como esponjas de microRNA (miRNA)17,18. Este papel regulatório dos circRNAs ocorre através da ligação complementar dos nucleotídeos do circRNA com a região da semente dos miRNAs. Esta interação circRNA-miRNA inibe as funções regulatórias normais dos miRNAs sobre os RNAm-alvo, regulando assim a expressão de genes 19,20. Além disso, circRNAs também são conhecidos por regular a expressão gênica interagindo com proteínas ligadoras de RNA (RBPs) e formando complexos RNA-proteína21. Embora os circRNAs sejam classificados como RNAs não codificantes, também há evidências de que os circRNAs podem atuar como moldes para a tradução deproteínas22,23,24.
Recentemente, foi demonstrado que os circRNAs desempenham papéis fundamentais na regulação das interações patógeno-hospedeiro, particularmente entre os hospedeiros e os vírus. Geralmente, acredita-se que os circRNAs do hospedeiro auxiliem na regulação das respostas imunes do hospedeiro para eliminar os patógenos invasores. Um exemplo de circRNA que promove respostas imunes do hospedeiro é circRNA_0082633, relatado por Guo et al.25. Esse circRNA aumenta a sinalização do interferon tipo I (IFN) dentro das células A549, o que ajuda a suprimir a replicação do vírus influenza25. Além disso, Qu e col. também relataram um circRNA intrônico humano, denominado circRNA AIVR, que promove imunidade regulando a expressão da proteína ligadora de CREB (CREBBP), um transdutor de sinal de IFN-β26,27. No entanto, circRNAs que são conhecidos por promover a patogênese da doença após a infecção também existem. Por exemplo, Yu e col. relataram recentemente o papel desempenhado por um circRNA emendado do domínio dedo de zinco GATA contendo o gene 2A (circGATAD2A) na promoção da replicação do vírus H1N1 através da inibição da autofagia da célula hospedeira28.
Para estudar efetivamente circRNAs, um algoritmo de predição de circRNA genômico é geralmente implementado, seguido por uma caracterização in silico dos candidatos a circRNA previstos antes que qualquer estudo funcional possa ser realizado. Tal abordagem de bioinformática para prever e caracterizar circRNAs é menos dispendiosa e mais eficiente em termos de tempo. Isso ajuda a refinar o número de candidatos a serem estudados funcionalmente e pode potencialmente levar a novas descobertas. Aqui, nós fornecemos um protocolo detalhado baseado em bioinformática para a identificação, caracterização e anotação funcional in silico de circRNAs durante as interações patógeno-hospedeiro. O protocolo inclui a identificação e quantificação de circRNAs a partir de conjuntos de dados de sequenciamento de RNA, anotação via circBase e a caracterização dos candidatos de circRNA em termos de tipos de circRNA, número de genes sobrepostos e interações circRNA-miRNA previstas. Este estudo também fornece a anotação funcional dos genes parentais do circRNA através da análise de enriquecimento da Gene Ontology (GO) e da Enciclopédia de Genes e Genomas de Kyoto (KEGG).
Neste protocolo, conjuntos de dados da biblioteca RNA-seq depletada de RNA-rribossomal desidentificados preparados a partir de células de macrófagos humanos infectadas pelo vírus influenza A foram baixados e usados do banco de dados Gene Expression Omnibus (GEO). Todo o pipeline de bioinformática, desde a predição até a caracterização funcional dos circRNAs, está resumido na Figura 1. Cada parte do gasoduto é explicada mais detalhadamente nas seções abaixo.
1. Preparação, download e configuração antes da análise dos dados
NOTA: Todos os pacotes de software utilizados neste estudo são gratuitos e de código aberto.
2. Predição e análise de expressão diferencial de circRNAs utilizando CIRIquant
NOTA: Um manual mais detalhado sobre como instalar e executar a análise de expressão diferencial pode ser encontrado na seção de disponibilidade de código do documento CIRIquant31. Os dados complementares também incluem alguns dos comandos básicos usados neste protocolo.
3. Caracterização e anotação de circRNAs DE previstos
4. Predição da interação circRNA-miRNA usando Circr
NOTA: Um manual mais detalhado sobre como instalar e usar o Circr para a análise da interação circRNA-miRNA pode ser encontrado em: https://github.com/bicciatolab/Circr37.
5. Construção da rede de ceRNA
NOTA: Um manual detalhado sobre como usar o Cytoscape pode ser encontrado em: http://manual.cytoscape.org/en/stable/ e https://github.com/cytoscape/cytoscape-tutorials/wiki#introduction
6. Análise do enriquecimento funcional
O protocolo alistado na seção anterior foi modificado e configurado para se adequar ao sistema operacional Linux. A principal razão é que a maioria das bibliotecas de módulos e pacotes envolvidos na análise de circRNAs só podem funcionar na plataforma Linux. Nesta análise, conjuntos de dados da biblioteca RNA-seq depletada de RNA-seq de RNA ribossomal não identificados, preparados a partir de células de macrófagos humanos infectadas pelo vírus Influenza A, foram baixados do banco de dados GEO
Para ilustrar a utilidade deste protocolo, RNA-seq de células de macrófagos humanos infectadas pelo vírus influenza A foi usado como exemplo. CircRNAs funcionando como potenciais esponjas de miRNA em interações patógeno-hospedeiro e seu enriquecimento funcional GO e KEGG dentro de um hospedeiro foram investigados. Embora haja uma variedade de ferramentas circRNA disponíveis on-line, cada uma delas é um pacote autônomo que não interage entre si. Aqui, reunimos algumas das ferramentas necessárias para predição...
Os autores não têm nada a revelar.
O autor gostaria de agradecer a Tan Ke En e ao Dr. Cameron Bracken pela revisão crítica deste manuscrito. Este trabalho foi apoiado por bolsas do Fundamental Research Grant Scheme (FRGS/1/2020/SKK0/UM/02/15) e University of Malaya High Impact Research Grant (UM. C/625/1/HIR/MOE/CHAN/02/07).
Name | Company | Catalog Number | Comments |
Bedtools | GitHub | https://github.com/arq5x/bedtools2/ | Referring to section 4.1.2. Needed for Circr. |
BWA | Burrows-Wheeler Aligner | http://bio-bwa.sourceforge.net/ | Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome |
Circr | GitHub | https://github.com/bicciatolab/Circr | Referring to section 4. Use to predict the miRNA binding sites |
CIRIquant | GitHub | https://github.com/bioinfo-biols/CIRIquant | Referring to section 2.1.3. To predict circRNAs |
Clusterprofiler | GitHub | https://github.com/YuLab-SMU/clusterProfiler | Referring to section 7. For GO and KEGG functional enrichment |
CPU | Intel | Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000) | Specifications used to run this entire protocol. |
Cytoscape | Cytoscape | https://cytoscape.org/download.html | Referring to section 5.2. Needed to plot ceRNA network |
FastQC | Babraham Bioinformatics | https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ | Referring to section 1.2.1. Quality checking on Fastq files |
HISAT2 | http://daehwankimlab.github.io/hisat2/ | Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome | |
Linux | Ubuntu 20.04.5 LTS (Focal Fossa) | https://releases.ubuntu.com/focal/ | Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol. |
miRanda | http://www.microrna.org/microrna/getDownloads.do | Referring to section 4.1.2. Needed for Circr | |
Pybedtools | pybedtools 0.8.2 | https://pypi.org/project/pybedtools/ | Needed for BED file genomic manipulation |
Python | Python 2.7 and 3.6 or abover | https://www.python.org/downloads/ | To run necessary library modules |
R | The Comprehensive R Archive Network | https://cran.r-project.org/ | To manipulate dataframes |
RNAhybrid | BiBiServ | https://bibiserv.cebitec.uni-bielefeld.de/rnahybrid | Referring to section 4.1.2. Needed for Circr |
RStudio | RStudio | https://www.rstudio.com/ | A workspace to run R |
samtools | SAMtools | http://www.htslib.org/ | Referring to section 2.1.2. Needed to run CIRIquant |
StringTie | Johns Hopkins University: Center for Computational Biology | http://ccb.jhu.edu/software/stringtie/index.shtml | Referring to section 2.1.2. Needed to run CIRIquant |
TargetScan | GitHub | https://github.com/nsoranzo/targetscan | Referring to section 4.1.2. Needed for Circr |
Solicitar permissão para reutilizar o texto ou figuras deste artigo JoVE
Solicitar PermissãoExplore Mais Artigos
This article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Todos os direitos reservados