Se requiere una suscripción a JoVE para ver este contenido. Inicie sesión o comience su prueba gratuita.
El protocolo presentado aquí explica la tubería in silico completa necesaria para predecir y caracterizar funcionalmente circRNAs a partir de datos de transcriptoma de secuenciación de ARN que estudian las interacciones huésped-patógeno.
Los ARN circulares (circRNAs) son una clase de RNAs no codificantes que se forman a través del retroempalme. Estos circRNAs se estudian predominantemente por su papel como reguladores de diversos procesos biológicos. En particular, la evidencia emergente demuestra que los circRNAs del huésped pueden expresarse diferencialmente (DE) tras la infección con patógenos (por ejemplo, influenza y coronavirus), lo que sugiere un papel para los circRNAs en la regulación de las respuestas inmunes innatas del huésped. Sin embargo, las investigaciones sobre el papel de los circRNAs durante las infecciones patogénicas están limitadas por el conocimiento y las habilidades necesarias para llevar a cabo el análisis bioinformático necesario para identificar los circRNAs DE a partir de datos de secuenciación de RNA (RNA-seq). La predicción bioinformática y la identificación de circRNAs es crucial antes de cualquier verificación, y estudios funcionales que utilizan técnicas de laboratorio húmedo costosas y que requieren mucho tiempo. Para resolver este problema, en este manuscrito se proporciona un protocolo paso a paso de predicción in silico y caracterización de circRNAs utilizando datos RNA-seq. El protocolo se puede dividir en cuatro pasos: 1) Predicción y cuantificación de circRNAs de DE a través del pipeline CIRIquant; 2) Anotación vía circBase y caracterización de circRNAs DE; 3) Predicción de la interacción CircRNA-miRNA a través de la tubería Circr; 4) análisis de enriquecimiento funcional de genes parentales circRNA utilizando Gene Ontology (GO) y Kyoto Encyclopedia of Genes and Genomes (KEGG). Esta tubería será útil para impulsar futuras investigaciones in vitro e in vivo para desentrañar aún más el papel de los circRNAs en las interacciones huésped-patógeno.
Las interacciones huésped-patógeno representan una interacción compleja entre los patógenos y los organismos huéspedes, lo que desencadena las respuestas inmunes innatas de los huéspedes que eventualmente resultan en la eliminación de patógenos invasores 1,2. Durante las infecciones patógenas, una multitud de genes inmunes del huésped se regula para inhibir la replicación y liberación de patógenos. Por ejemplo, los genes comunes estimulados por interferón (ISG) regulados por infecciones patógenas incluyen ADAR1, IFIT1, IFIT2, IFIT3, ISG20, RIG-I y OASL 3,4. Además de los genes codificadores de proteínas, los estudios también han informado que los ARN no codificantes, como los ARN largos no codificantes (lncRNAs), los microARN (miRNAs) y los RNAs circulares (circRNAs) también juegan un papel y están regulados simultáneamente durante las infecciones patogénicas 5,6,7. A diferencia de los genes codificadores de proteínas que codifican principalmente proteínas como moléculas funcionales, se sabe que los ARN no codificantes (ncRNA) funcionan como reguladores de genes a nivel transcripcional y posttranscripcional. Sin embargo, los estudios que involucran la participación de ARN no codificantes, particularmente circRNAs, en la regulación de los genes inmunes de los huéspedes no están bien informados en comparación con los genes codificadores de proteínas.
Los CircRNAs se caracterizan ampliamente por su estructura de bucle continuo covalentemente cerrado, que se genera a través de un proceso de empalme no canónico llamado retroempalme8. El proceso de empalme posterior, a diferencia del proceso de empalme de ARN lineales afines, implica la ligadura del sitio donante aguas abajo al sitio aceptor aguas arriba, formando una estructura de forma circular. Actualmente, se han propuesto tres mecanismos diferentes de empalme posterior para la biogénesis de circRNAs. Estos son la circularización mediada por proteína de unión al ARN (RBP) 9,10, la circularización impulsada por el emparejamiento intrón 11 y la circularización impulsada por lariat12,13,14. Dado que los circRNAs están conectados de extremo a extremo en una estructura circular, tienden a ser naturalmente resistentes a las digestiones normales de exonucleasas y, por lo tanto, se consideran más estables que sus contrapartes lineales15. Otra característica común exhibida por circRNAs incluye la expresión específica del tipo de célula o tejido en los huéspedes16.
Como lo implica su estructura única y la expresión específica de células o tejidos, se ha descubierto que los circRNAs desempeñan importantes funciones biológicas en las células. Hasta la fecha, una de las funciones prominentes de los circRNAs es su papel como esponjas de microRNA (miRNA)17,18. Este papel regulador de los circRNAs ocurre a través de la unión complementaria de los nucleótidos circRNA con la región semilla de los miRNAs. Tal interacción circRNA-miRNA inhibe las funciones reguladoras normales de los miRNAs en los mRNAs diana, regulando así la expresión de genes19,20. Además, también se sabe que los circRNAs regulan la expresión génica interactuando con proteínas de unión a ARN (RBP) y formando complejos ARN-proteína21. Aunque los circRNAs se clasifican como RNAs no codificantes, también hay evidencia de que los circRNAs pueden actuar como plantillas para la traducción de proteínas22,23,24.
Recientemente, se ha demostrado que los circRNAs desempeñan un papel fundamental en la regulación de las interacciones huésped-patógeno, particularmente entre los huéspedes y los virus. En general, se supone que los circRNAs del huésped ayudan a regular las respuestas inmunes del huésped para eliminar los patógenos invasores. Un ejemplo de circRNA que promueve las respuestas inmunes del huésped es circRNA_0082633, reportado por Guo et al.25. Este circRNA mejora la señalización del interferón tipo I (IFN) dentro de las células A549, lo que ayuda a suprimir la replicación del virus de la influenza25. Además, Qu et al. también reportaron un circRNA intrónico humano, llamado circRNA AIVR, que promueve la inmunidad al regular la expresión de la proteína de unión a CREB (CREBBP), un transductor de señal de IFN-β26,27. Sin embargo, también existen circRNAs que se sabe que promueven la patogénesis de la enfermedad tras la infección. Por ejemplo, Yu et al. informaron recientemente el papel desempeñado por un circRNA empalmado del dominio del dedo de zinc GATA que contiene el gen 2A (circGATAD2A) en la promoción de la replicación del virus H1N1 a través de la inhibición de la autofagia de la célula huésped28.
Para estudiar eficazmente los circRNAs, generalmente se implementa un algoritmo de predicción de circRNA de todo el genoma, seguido de una caracterización in silico de los candidatos de circRNA predichos antes de que se puedan llevar a cabo estudios funcionales. Tal enfoque bioinformático para predecir y caracterizar circRNAs es menos costoso y más eficiente en el tiempo. Ayuda a refinar el número de candidatos a estudiar funcionalmente y podría conducir a nuevos hallazgos. Aquí, proporcionamos un protocolo detallado basado en bioinformática para la identificación, caracterización y anotación funcional in silico de circRNAs durante las interacciones huésped-patógeno. El protocolo incluye la identificación y cuantificación de circRNAs a partir de conjuntos de datos de secuenciación de RNA, anotación a través de circBase y la caracterización de los candidatos circRNA en términos de tipos de circRNA, número de genes superpuestos e interacciones circRNA-miRNA previstas. Este estudio también proporciona la anotación funcional de los genes parentales circRNA a través de Gene Ontology (GO) y el análisis de enriquecimiento de la Enciclopedia de Genes y Genomas de Kyoto (KEGG).
En este protocolo, se descargaron y utilizaron conjuntos de datos de la biblioteca RNA-seq sin ARN ribosómico (ARNr) desidentificados preparados a partir de las células macrófagas humanas infectadas con el virus de la influenza A y se utilizaron de la base de datos Gene Expression Omnibus (GEO). Toda la línea de bioinformática desde la predicción hasta la caracterización funcional de circRNAs se resume en la Figura 1. Cada parte de la tubería se explica con más detalle en las secciones siguientes.
1. Preparación, descarga y configuración antes del análisis de datos
NOTA: Todos los paquetes de software utilizados en este estudio son gratuitos y de código abierto.
2. Predicción y análisis de expresión diferencial de circRNAs utilizando CIRIquant
NOTA: Se puede encontrar un manual más detallado sobre la instalación y realización del análisis de expresiones diferenciales en la sección de disponibilidad de código del documento31 de CIRIquant. Los datos suplementarios también incluyen algunos de los comandos básicos utilizados en este protocolo.
3. Caracterización y anotación de circRNAs DE predichos
4. Predicción de la interacción circRNA-miRNA usando Circr
NOTA: Un manual más detallado sobre cómo instalar y usar Circr para el análisis de interacción circRNA-miRNA se puede encontrar en: https://github.com/bicciatolab/Circr37.
5. Construcción de la red de ceRNA
NOTA: Un manual detallado sobre cómo usar Cytoscape se puede encontrar en: http://manual.cytoscape.org/en/stable/ y https://github.com/cytoscape/cytoscape-tutorials/wiki#introduction
6. Análisis de enriquecimiento funcional
El protocolo alistado en la sección anterior se modificó y configuró para adaptarse al sistema operativo Linux. La razón principal es que la mayoría de las bibliotecas de módulos y paquetes involucrados en el análisis de circRNAs solo pueden funcionar en la plataforma Linux. En este análisis, los conjuntos de datos de la biblioteca RNA-seq sin ARN ribosómico (ARNr) desidentificados preparados a partir de las células macrófagas humanas infectadas con el virus de la influenza A se descargaron de la base de datos...
Para ilustrar la utilidad de este protocolo, se utilizó como ejemplo el RNA-seq de células macrófagas humanas infectadas con el virus de la influenza A. Se investigaron los circRNAs que funcionan como posibles esponjas de miRNA en las interacciones huésped-patógeno y su enriquecimiento funcional GO y KEGG dentro de un huésped. Aunque hay una variedad de herramientas de circRNA disponibles en línea, cada una de ellas es un paquete independiente que no interactúa entre sí. Aquí, reunimos algunas de las herramient...
Los autores no tienen nada que revelar.
El autor desea agradecer a Tan Ke En y al Dr. Cameron Bracken por su revisión crítica de este manuscrito. Este trabajo fue apoyado por subvenciones del Plan de Becas de Investigación Fundamental (FRGS / 1/2020 / SKK0 / UM / 02/15) y la Beca de Investigación de Alto Impacto de la Universidad de Malaya (UM. C/625/1/HIR/MOE/CHAN/02/07).
Name | Company | Catalog Number | Comments |
Bedtools | GitHub | https://github.com/arq5x/bedtools2/ | Referring to section 4.1.2. Needed for Circr. |
BWA | Burrows-Wheeler Aligner | http://bio-bwa.sourceforge.net/ | Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome |
Circr | GitHub | https://github.com/bicciatolab/Circr | Referring to section 4. Use to predict the miRNA binding sites |
CIRIquant | GitHub | https://github.com/bioinfo-biols/CIRIquant | Referring to section 2.1.3. To predict circRNAs |
Clusterprofiler | GitHub | https://github.com/YuLab-SMU/clusterProfiler | Referring to section 7. For GO and KEGG functional enrichment |
CPU | Intel | Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000) | Specifications used to run this entire protocol. |
Cytoscape | Cytoscape | https://cytoscape.org/download.html | Referring to section 5.2. Needed to plot ceRNA network |
FastQC | Babraham Bioinformatics | https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ | Referring to section 1.2.1. Quality checking on Fastq files |
HISAT2 | http://daehwankimlab.github.io/hisat2/ | Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome | |
Linux | Ubuntu 20.04.5 LTS (Focal Fossa) | https://releases.ubuntu.com/focal/ | Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol. |
miRanda | http://www.microrna.org/microrna/getDownloads.do | Referring to section 4.1.2. Needed for Circr | |
Pybedtools | pybedtools 0.8.2 | https://pypi.org/project/pybedtools/ | Needed for BED file genomic manipulation |
Python | Python 2.7 and 3.6 or abover | https://www.python.org/downloads/ | To run necessary library modules |
R | The Comprehensive R Archive Network | https://cran.r-project.org/ | To manipulate dataframes |
RNAhybrid | BiBiServ | https://bibiserv.cebitec.uni-bielefeld.de/rnahybrid | Referring to section 4.1.2. Needed for Circr |
RStudio | RStudio | https://www.rstudio.com/ | A workspace to run R |
samtools | SAMtools | http://www.htslib.org/ | Referring to section 2.1.2. Needed to run CIRIquant |
StringTie | Johns Hopkins University: Center for Computational Biology | http://ccb.jhu.edu/software/stringtie/index.shtml | Referring to section 2.1.2. Needed to run CIRIquant |
TargetScan | GitHub | https://github.com/nsoranzo/targetscan | Referring to section 4.1.2. Needed for Circr |
Solicitar permiso para reutilizar el texto o las figuras de este JoVE artículos
Solicitar permisoExplorar más artículos
This article has been published
Video Coming Soon
ACERCA DE JoVE
Copyright © 2025 MyJoVE Corporation. Todos los derechos reservados