Iniciar sesión

Se requiere una suscripción a JoVE para ver este contenido. Inicie sesión o comience su prueba gratuita.

En este artículo

  • Resumen
  • Resumen
  • Introducción
  • Protocolo
  • Resultados
  • Discusión
  • Divulgaciones
  • Agradecimientos
  • Materiales
  • Referencias
  • Reimpresiones y Permisos

Resumen

El protocolo presentado aquí explica la tubería in silico completa necesaria para predecir y caracterizar funcionalmente circRNAs a partir de datos de transcriptoma de secuenciación de ARN que estudian las interacciones huésped-patógeno.

Resumen

Los ARN circulares (circRNAs) son una clase de RNAs no codificantes que se forman a través del retroempalme. Estos circRNAs se estudian predominantemente por su papel como reguladores de diversos procesos biológicos. En particular, la evidencia emergente demuestra que los circRNAs del huésped pueden expresarse diferencialmente (DE) tras la infección con patógenos (por ejemplo, influenza y coronavirus), lo que sugiere un papel para los circRNAs en la regulación de las respuestas inmunes innatas del huésped. Sin embargo, las investigaciones sobre el papel de los circRNAs durante las infecciones patogénicas están limitadas por el conocimiento y las habilidades necesarias para llevar a cabo el análisis bioinformático necesario para identificar los circRNAs DE a partir de datos de secuenciación de RNA (RNA-seq). La predicción bioinformática y la identificación de circRNAs es crucial antes de cualquier verificación, y estudios funcionales que utilizan técnicas de laboratorio húmedo costosas y que requieren mucho tiempo. Para resolver este problema, en este manuscrito se proporciona un protocolo paso a paso de predicción in silico y caracterización de circRNAs utilizando datos RNA-seq. El protocolo se puede dividir en cuatro pasos: 1) Predicción y cuantificación de circRNAs de DE a través del pipeline CIRIquant; 2) Anotación vía circBase y caracterización de circRNAs DE; 3) Predicción de la interacción CircRNA-miRNA a través de la tubería Circr; 4) análisis de enriquecimiento funcional de genes parentales circRNA utilizando Gene Ontology (GO) y Kyoto Encyclopedia of Genes and Genomes (KEGG). Esta tubería será útil para impulsar futuras investigaciones in vitro e in vivo para desentrañar aún más el papel de los circRNAs en las interacciones huésped-patógeno.

Introducción

Las interacciones huésped-patógeno representan una interacción compleja entre los patógenos y los organismos huéspedes, lo que desencadena las respuestas inmunes innatas de los huéspedes que eventualmente resultan en la eliminación de patógenos invasores 1,2. Durante las infecciones patógenas, una multitud de genes inmunes del huésped se regula para inhibir la replicación y liberación de patógenos. Por ejemplo, los genes comunes estimulados por interferón (ISG) regulados por infecciones patógenas incluyen ADAR1, IFIT1, IFIT2, IFIT3, ISG20, RIG-I y OASL 3,4. Además de los genes codificadores de proteínas, los estudios también han informado que los ARN no codificantes, como los ARN largos no codificantes (lncRNAs), los microARN (miRNAs) y los RNAs circulares (circRNAs) también juegan un papel y están regulados simultáneamente durante las infecciones patogénicas 5,6,7. A diferencia de los genes codificadores de proteínas que codifican principalmente proteínas como moléculas funcionales, se sabe que los ARN no codificantes (ncRNA) funcionan como reguladores de genes a nivel transcripcional y posttranscripcional. Sin embargo, los estudios que involucran la participación de ARN no codificantes, particularmente circRNAs, en la regulación de los genes inmunes de los huéspedes no están bien informados en comparación con los genes codificadores de proteínas.

Los CircRNAs se caracterizan ampliamente por su estructura de bucle continuo covalentemente cerrado, que se genera a través de un proceso de empalme no canónico llamado retroempalme8. El proceso de empalme posterior, a diferencia del proceso de empalme de ARN lineales afines, implica la ligadura del sitio donante aguas abajo al sitio aceptor aguas arriba, formando una estructura de forma circular. Actualmente, se han propuesto tres mecanismos diferentes de empalme posterior para la biogénesis de circRNAs. Estos son la circularización mediada por proteína de unión al ARN (RBP) 9,10, la circularización impulsada por el emparejamiento intrón 11 y la circularización impulsada por lariat12,13,14. Dado que los circRNAs están conectados de extremo a extremo en una estructura circular, tienden a ser naturalmente resistentes a las digestiones normales de exonucleasas y, por lo tanto, se consideran más estables que sus contrapartes lineales15. Otra característica común exhibida por circRNAs incluye la expresión específica del tipo de célula o tejido en los huéspedes16.

Como lo implica su estructura única y la expresión específica de células o tejidos, se ha descubierto que los circRNAs desempeñan importantes funciones biológicas en las células. Hasta la fecha, una de las funciones prominentes de los circRNAs es su papel como esponjas de microRNA (miRNA)17,18. Este papel regulador de los circRNAs ocurre a través de la unión complementaria de los nucleótidos circRNA con la región semilla de los miRNAs. Tal interacción circRNA-miRNA inhibe las funciones reguladoras normales de los miRNAs en los mRNAs diana, regulando así la expresión de genes19,20. Además, también se sabe que los circRNAs regulan la expresión génica interactuando con proteínas de unión a ARN (RBP) y formando complejos ARN-proteína21. Aunque los circRNAs se clasifican como RNAs no codificantes, también hay evidencia de que los circRNAs pueden actuar como plantillas para la traducción de proteínas22,23,24.

Recientemente, se ha demostrado que los circRNAs desempeñan un papel fundamental en la regulación de las interacciones huésped-patógeno, particularmente entre los huéspedes y los virus. En general, se supone que los circRNAs del huésped ayudan a regular las respuestas inmunes del huésped para eliminar los patógenos invasores. Un ejemplo de circRNA que promueve las respuestas inmunes del huésped es circRNA_0082633, reportado por Guo et al.25. Este circRNA mejora la señalización del interferón tipo I (IFN) dentro de las células A549, lo que ayuda a suprimir la replicación del virus de la influenza25. Además, Qu et al. también reportaron un circRNA intrónico humano, llamado circRNA AIVR, que promueve la inmunidad al regular la expresión de la proteína de unión a CREB (CREBBP), un transductor de señal de IFN-β26,27. Sin embargo, también existen circRNAs que se sabe que promueven la patogénesis de la enfermedad tras la infección. Por ejemplo, Yu et al. informaron recientemente el papel desempeñado por un circRNA empalmado del dominio del dedo de zinc GATA que contiene el gen 2A (circGATAD2A) en la promoción de la replicación del virus H1N1 a través de la inhibición de la autofagia de la célula huésped28.

Para estudiar eficazmente los circRNAs, generalmente se implementa un algoritmo de predicción de circRNA de todo el genoma, seguido de una caracterización in silico de los candidatos de circRNA predichos antes de que se puedan llevar a cabo estudios funcionales. Tal enfoque bioinformático para predecir y caracterizar circRNAs es menos costoso y más eficiente en el tiempo. Ayuda a refinar el número de candidatos a estudiar funcionalmente y podría conducir a nuevos hallazgos. Aquí, proporcionamos un protocolo detallado basado en bioinformática para la identificación, caracterización y anotación funcional in silico de circRNAs durante las interacciones huésped-patógeno. El protocolo incluye la identificación y cuantificación de circRNAs a partir de conjuntos de datos de secuenciación de RNA, anotación a través de circBase y la caracterización de los candidatos circRNA en términos de tipos de circRNA, número de genes superpuestos e interacciones circRNA-miRNA previstas. Este estudio también proporciona la anotación funcional de los genes parentales circRNA a través de Gene Ontology (GO) y el análisis de enriquecimiento de la Enciclopedia de Genes y Genomas de Kyoto (KEGG).

Protocolo

En este protocolo, se descargaron y utilizaron conjuntos de datos de la biblioteca RNA-seq sin ARN ribosómico (ARNr) desidentificados preparados a partir de las células macrófagas humanas infectadas con el virus de la influenza A y se utilizaron de la base de datos Gene Expression Omnibus (GEO). Toda la línea de bioinformática desde la predicción hasta la caracterización funcional de circRNAs se resume en la Figura 1. Cada parte de la tubería se explica con más detalle en las secciones siguientes.

1. Preparación, descarga y configuración antes del análisis de datos

NOTA: Todos los paquetes de software utilizados en este estudio son gratuitos y de código abierto.

  1. Descarga de las herramientas necesarias en la plataforma Linux
    1. Descargue e instale el software y las herramientas necesarias que se enumeran en la Tabla de materiales en una computadora Linux de alto rendimiento siguiendo las instrucciones proporcionadas por el desarrollador.
      NOTA: La mayoría de las herramientas y el software tienen sus propias páginas de GitHub en línea o documentación que contiene instrucciones sobre cómo instalar y usar sus herramientas (consulte la Tabla de materiales).
    2. Descargue los conjuntos de datos de RNA-seq deseados para la detección y el análisis de circRNA de los sitios web de archivos de secuencias (por ejemplo, European Nucleotides Archive y Gene Expression Omnibus).
    3. Descargue los genomas de referencia (formato FASTA) y los archivos de anotación (formato GTF/GFF3), compatibles con el host a partir del cual se preparó el conjunto de datos RNA-seq. Los genomas de referencia del host y los archivos de anotación generalmente se encuentran en navegadores de genomas en línea, como el Centro Nacional de Información Biotecnológica (NCBI), la Universidad de California Santa Cruz (UCSC) y los sitios web de Ensembl.
  2. Control de calidad de RNA-seq
    1. Introduzca los archivos FASTQ en el programa FASTQC para determinar la calidad de las secuencias de ARN. Si la calidad de los archivos FASTQ es baja (por ejemplo, 29,30.

2. Predicción y análisis de expresión diferencial de circRNAs utilizando CIRIquant

NOTA: Se puede encontrar un manual más detallado sobre la instalación y realización del análisis de expresiones diferenciales en la sección de disponibilidad de código del documento31 de CIRIquant. Los datos suplementarios también incluyen algunos de los comandos básicos utilizados en este protocolo.

  1. Predicciones de CircRNA
    1. Indexar primero el genoma de referencia del huésped utilizando alineadores BWA y HISAT2. Luego, en un terminal Linux, ejecute los comandos bwa index 32 y hisat2-build33 en el directorio del genoma de referencia del host para indexarlo.
    2. A continuación, prepare un archivo de configuración YML que contenga el nombre del archivo, la ruta de acceso de las herramientas (BWA, HISAT2, stringtie34, samtools35), la ruta a los archivos de referencia descargados (archivos FASTA del genoma de referencia del host, archivos de anotación) y la ruta a los archivos de índice desde el paso 2.1.1.
    3. Ejecute la herramienta CIRIquant desde el terminal utilizando los parámetros predeterminados o manuales. El usuario puede especificar el tipo de biblioteca (trenzada o no trenzada) de los datos RNA-seq al ejecutar la herramienta CIRIquant.
      NOTA: El tipo de biblioteca de los datos RNA-seq se puede determinar conociendo el tipo de kit de preparación de biblioteca utilizado. Si se desconoce la identidad del kit de preparación de la biblioteca, se puede usar un paquete bioinformático de control de RNA-seq llamado RSeQC36 para determinar el varado de los datos de RNA-seq.
  2. Análisis de expresiones diferenciales
    NOTA: El paquete CIRIquant incluye prep_CIRIquant, prepDE.py y CIRI_DE_replicate; Por lo tanto, no se necesitan descargas adicionales para estas tres herramientas.
    1. Prepare un archivo de texto (.lst) con una lista de datos que contenga lo siguiente:
      columna: ID de los datos RNA-seq utilizados en el paso 2.1.3
      columna: ruta a los archivos GTF generados por CIRIquant
      columna: agrupación de los datos RNA-seq, ya sea un grupo control o tratado.
    2. Para ver un ejemplo, consulte la Tabla 1 a continuación.
      NOTA: No es necesario poner los encabezados ya que son solo para referencia.
    3. En el terminal Linux, ejecute prep_CIRIquant con el archivo de texto (.lst) preparado en el paso 2.2.1 como entrada. La ejecución generará una lista de archivos: library_info.csv, circRNA_info.csv, circRNA_bsj.csv y circRNA_ratio.csv.
    4. Prepare un segundo archivo de texto con una lista de datos que contengan los ID de RNA-seq y la ruta a su respectiva salida StringTie. El diseño del archivo debe ser similar al archivo de texto del paso 2.2.1 sin la columna de agrupación.
    5. Ejecute prepDE.py con el archivo de texto preparado en el paso 2.2.4 como entrada para generar los archivos de matriz de recuento de genes.
    6. Ejecute CIRI_DE_replicate con los archivos library_info.csv y circRNA_bsj.csv del paso 2.2.3 y el archivo gene_count_matrix.csv del paso 2.2.5 como entradas para generar el archivo circRNA_de.tsv final.
  3. Filtrado de circRNAs de DE
    1. Utilice R (en el terminal de la computadora o RStudio) o cualquier software de hoja de cálculo (por ejemplo, Microsoft Excel) para abrir el archivo circRNA_de.tsv generado en el paso 2.2.6 para filtrar y determinar el número de circRNAs expresados diferencialmente (DE).
    2. Filtrar los circRNAs DE según los criterios LogFC > |2| y FDR < 0,05.
    3. Cree un archivo denominado DE_circRNAs.txt para almacenar la información de los circRNAs DE.

3. Caracterización y anotación de circRNAs DE predichos

  1. Estado de anotación de circRNAs DE
    1. Cargue el archivo denominado DE_circRNAs.txt en RStudio , que consiste en la lista de circRNAs DE filtrados desde el paso 2.3.3. Incluya otra información, como las posiciones genómicas (Chr, Start, End), las orientaciones de la cadena (+ o -), el nombre del gen y el tipo de circRNA. Antes de continuar, convierta las coordenadas genómicas de inicio de circRNA de CIRIquant a 0-based restando 1 par de bases.
      NOTA: El resto de la información indicada anteriormente puede obtenerse de los archivos GTF generados por CIRIquant (Archivo complementario 1).
    2. Determine el estado de anotación de los circRNAs DE predichos descargando una biblioteca que contenga las posiciones genómicas de la base de datos circRNA-database (por ejemplo, circBase) depositados circRNAs.
      NOTA: Asegúrese de que la versión del genoma utilizada para predecir los circRNAs es idéntica a la biblioteca de base de datos circRNA antes de hacer la comparación. El archivo de datos circBase utilizado aquí está disponible gratuitamente en la carpeta de la unidad proporcionada en Github (https://github.com/bicciatolab/Circr)37.
    3. Una vez preparados los archivos del paso 3.1.1 y del paso 3.1.2, ejecute el script R que figura en el archivo complementario 1. Las ubicaciones cromosómicas de los circRNAs DE se consultan a la biblioteca antes de asignar el estado Anotado o No anotado.
  2. Caracterización de circRNAs de DE
    1. Use R y otro software de hoja de cálculo para resumir el número de circRNAs de acuerdo con los tipos de circRNA (es decir, exón, intrón, intergénico y antisentido) y el número de genes que abarcan los circRNAs (1 o >1) (Archivo complementario 1).NOTA: CIRIquant sólo puede detectar cuatro tipos de circRNAs (exón, intrón, intergénico y antisentido). Los circRNAs exón-intrón, también conocidos como ElciRNAs, no pueden ser detectados por CIRIquant.

4. Predicción de la interacción circRNA-miRNA usando Circr

NOTA: Un manual más detallado sobre cómo instalar y usar Circr para el análisis de interacción circRNA-miRNA se puede encontrar en: https://github.com/bicciatolab/Circr37.

  1. Preparación de expedientes
    1. Descomprima y extraiga el contenido del archivo Circr.zip después de descargarlo de la página de Circr GitHub utilizando el software relevante como "WinRar" o "7-zip" en un nuevo directorio donde se realizará el análisis.
    2. Instale las aplicaciones de software necesarias (miRanda, RNAhybrid, Pybedtools y samtools) antes de realizar el análisis circRNA-miRNA.
    3. Los genomas de referencia y los archivos de anotación para varios organismos de interés, el archivo de coordenadas de ARNr, el archivo de interacción de miARN validado y los archivos circARN de circBase son proporcionados por el autor de Circr en la página de Github (https://github.com/bicciatolab/Circr)37. Al hacer clic en los archivos de soporte en la carpeta de la unidad, seleccione la carpeta para el organismo de interés, la carpeta de miRNA y el archivo de texto circBase y descárguelo.
    4. Después de descargar los archivos necesarios en el paso 4.1.3, cree un nuevo directorio denominado support_files en el directorio mencionado en el paso 4.1.1. Luego, descomprima y extraiga el contenido en el directorio support_files .
    5. Indexar el archivo genómico de referencia del organismo de interés utilizando el comando samtools faidx (Archivo complementario 1).
    6. Prepare un archivo de entrada que consista en las coordenadas de los circRNAs DE de interés en un archivo BED delimitado por tabulaciones, como se muestra en la Tabla 2.
      NOTA: Debido a que los circRNAs predichos por CIRIquant no están basados en 0, es necesario menos 1 pb en la coordenada inicial (como se mencionó en el paso 3.1.1) antes de convertirlos al formato BED. Los encabezados que se muestran en la Tabla 2 son solo para referencia y no son necesarios en los archivos BED.
    7. En este punto, asegúrese de que la estructura de árbol de carpetas esperada para el análisis Circr sea como en la figura 2.
  2. Ejecución Circr.py
    1. Ejecute Circr.py usando Python 3 y, como argumentos, especifique el archivo de entrada circRNA, el genoma FASTA del organismo de interés, la versión del genoma del organismo seleccionado, el número de subprocesos y el nombre del archivo de salida en la línea de comandos.
    2. Si el organismo de interés no se proporciona en la carpeta de la unidad enumerada en el paso 4.1.3 o si el usuario prefiere tener un conjunto personalizado de archivos para ejecutar el análisis, se deben incluir comandos adicionales que especifiquen la ubicación de estos archivos al ejecutar Circr.py.
    3. Una vez completado el análisis Circr, el programa genera un archivo de interacción circRNA-miRNA en formato csv.
    4. Filtre los resultados de la interacción circRNA-miRNA de acuerdo con la preferencia específica del usuario. Para este estudio, las predicciones se filtran utilizando Rstudio de acuerdo con los siguientes criterios:
      -Detectado por las tres herramientas de software
      -Dos o más sitios de enlace reportados por Targetscan y miRanda
      -Identificado en las columnas "AGO" o "validado"
      -Filtrar las interacciones de la región de la semilla
    5. Escriba los circRNAs que pasan las condiciones filtradas del paso 4.2.3 en un nuevo archivo de texto denominado circRNA_miRNA.txt. Tal filtrado puede aumentar la confianza de las interacciones predichas.

5. Construcción de la red de ceRNA

NOTA: Un manual detallado sobre cómo usar Cytoscape se puede encontrar en: http://manual.cytoscape.org/en/stable/ y https://github.com/cytoscape/cytoscape-tutorials/wiki#introduction

  1. Descarga y preparación
    1. Descargue la última versión de Cytoscape38 desde: https://cytoscape.org/download.html.
    2. Ejecute el asistente de instalación descargado en el paso 5.1.1 y seleccione la ubicación del archivo para el software Cytoscape.
    3. Prepare un archivo delimitado por tabuladores que contenga los circRNAs de interés y su miRNA diana. La primera columna consiste en el nombre circRNA; la segunda columna especifica el tipo de ARN de la primera columna; la tercera columna es el miARN objetivo; y la cuarta columna especifica el tipo de ARN de la tercera columna. En la tabla 3 se muestra un ejemplo del archivo.
  2. Construyendo el mapa de red de ceRNA
    1. Abra el software Cytoscape instalado en el paso 5.1.2.
    2. En Cytoscape, navegue hasta Archivo > Importar > red desde archivo. Seleccione el archivo que se ha preparado en el paso 5.1.3.
    3. En la nueva pestaña, seleccione la primera y segunda columna como "Nodo de origen" y "Atributo de nodo de origen", mientras que seleccione la tercera y cuarta columna como "Nodo de destino" y "Atributo de nodo de destino" respectivamente. Haga clic en Aceptar y la red aparecerá en la parte superior derecha de Cytoscape.
    4. Para cambiar el estilo visual de la red, presione el botón Estilo en el lado izquierdo de Cytoscape.
    5. Presione la flecha en el lado derecho de Color de relleno. Elija Tipo para la columna y Asignación discreta para el tipo de asignación. Luego, seleccione el color deseado para cada uno de los tipos de ARN.
    6. Después de cambiar el color, cambie la forma de los nodos navegando a Forma y siguiendo el paso 5.2.5.

6. Análisis de enriquecimiento funcional

  1. Análisis de Gene Ontology (GO) y Kyoto Encyclopedia of Genes and Genomes (KEGG) para el gen parental de los circRNAs
    1. Asegúrese de que clusterProfiler 39,40 y org. Hs.eg.db se han instalado 41 paquetes en Rstudio. La org. El paquete Hs.eg.db41 es un paquete de anotaciones de todo el genoma solo para humanos. Si el organismo de interés es otra especie, refiérase: https://bioconductor.org/packages/release/BiocViews.html#OrgDb
    2. Importe la información DE_circRNA del paso 2.3.1 en el espacio de trabajo de Rstudio.
    3. Utilice el gen parental de los circRNAs proporcionados en este archivo para el análisis de enriquecimiento en los próximos pasos. Sin embargo, si el usuario desea convertir el símbolo del gen a otros formatos, como el ID de entrez, utilice una función como "bitr".
    4. Utilizando el identificador genético como entrada, ejecute el análisis de enriquecimiento de GO utilizando la función enrichGO dentro del paquete clusterProfiler39,40 utilizando parámetros predeterminados.
    5. Utilizando el identificador genético como entrada, ejecute el análisis de enriquecimiento KEGG utilizando la función enrichKEGG dentro del paquete clusterProfiler39,40 utilizando los parámetros predeterminados.

Resultados

El protocolo alistado en la sección anterior se modificó y configuró para adaptarse al sistema operativo Linux. La razón principal es que la mayoría de las bibliotecas de módulos y paquetes involucrados en el análisis de circRNAs solo pueden funcionar en la plataforma Linux. En este análisis, los conjuntos de datos de la biblioteca RNA-seq sin ARN ribosómico (ARNr) desidentificados preparados a partir de las células macrófagas humanas infectadas con el virus de la influenza A se descargaron de la base de datos...

Discusión

Para ilustrar la utilidad de este protocolo, se utilizó como ejemplo el RNA-seq de células macrófagas humanas infectadas con el virus de la influenza A. Se investigaron los circRNAs que funcionan como posibles esponjas de miRNA en las interacciones huésped-patógeno y su enriquecimiento funcional GO y KEGG dentro de un huésped. Aunque hay una variedad de herramientas de circRNA disponibles en línea, cada una de ellas es un paquete independiente que no interactúa entre sí. Aquí, reunimos algunas de las herramient...

Divulgaciones

Los autores no tienen nada que revelar.

Agradecimientos

El autor desea agradecer a Tan Ke En y al Dr. Cameron Bracken por su revisión crítica de este manuscrito. Este trabajo fue apoyado por subvenciones del Plan de Becas de Investigación Fundamental (FRGS / 1/2020 / SKK0 / UM / 02/15) y la Beca de Investigación de Alto Impacto de la Universidad de Malaya (UM. C/625/1/HIR/MOE/CHAN/02/07).

Materiales

NameCompanyCatalog NumberComments
BedtoolsGitHubhttps://github.com/arq5x/bedtools2/Referring to section 4.1.2. Needed for Circr.
BWABurrows-Wheeler Alignerhttp://bio-bwa.sourceforge.net/Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
CircrGitHubhttps://github.com/bicciatolab/CircrReferring to section 4. Use to predict the miRNA binding sites
CIRIquantGitHubhttps://github.com/bioinfo-biols/CIRIquantReferring to section 2.1.3. To predict circRNAs
ClusterprofilerGitHubhttps://github.com/YuLab-SMU/clusterProfilerReferring to section 7. For GO and KEGG functional enrichment
CPUIntel Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz   Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000) Specifications used to run this entire protocol.
CytoscapeCytoscapehttps://cytoscape.org/download.htmlReferring to section 5.2. Needed to plot ceRNA network
FastQCBabraham Bioinformaticshttps://www.bioinformatics.babraham.ac.uk/projects/fastqc/Referring to section 1.2.1. Quality checking on Fastq files
HISAT2http://daehwankimlab.github.io/hisat2/Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
LinuxUbuntu 20.04.5 LTS (Focal Fossa)https://releases.ubuntu.com/focal/Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol.
miRandahttp://www.microrna.org/microrna/getDownloads.doReferring to section 4.1.2. Needed for Circr
Pybedtoolspybedtools 0.8.2https://pypi.org/project/pybedtools/Needed for BED file genomic manipulation
PythonPython 2.7 and 3.6 or aboverhttps://www.python.org/downloads/To run necessary library modules
RThe Comprehensive R Archive Networkhttps://cran.r-project.org/To manipulate dataframes
RNAhybridBiBiServhttps://bibiserv.cebitec.uni-bielefeld.de/rnahybridReferring to section 4.1.2. Needed for Circr
RStudioRStudiohttps://www.rstudio.com/A workspace to run R
samtools SAMtoolshttp://www.htslib.org/Referring to section 2.1.2. Needed to run CIRIquant
StringTieJohns Hopkins University: Center for Computational Biologyhttp://ccb.jhu.edu/software/stringtie/index.shtmlReferring to section 2.1.2. Needed to run CIRIquant
TargetScanGitHubhttps://github.com/nsoranzo/targetscanReferring to section 4.1.2. Needed for Circr

Referencias

  1. Raman, K., Bhat, A. G., Chandra, N. A systems perspective of host-pathogen interactions: predicting disease outcome in tuberculosis. Molecular BioSystems. 6 (3), 516-530 (2010).
  2. Casadevall, A., Pirofski, L. A. Host-pathogen interactions: basic concepts of microbial commensalism, colonization, infection, and disease. Infection and Immunity. 68 (12), 6511-6518 (2000).
  3. Yang, E., Li, M. M. H. All About the RNA: Interferon-stimulated genes that interfere with viral RNA processes. Frontiers in Immunology. 11, 605024 (2020).
  4. Schneider, W. M., Chevillotte, M. D., Rice, C. M. Interferon-stimulated genes: A complex web of host defenses. Annual Review of Immunology. 32 (1), 513-545 (2014).
  5. Shirahama, S., Miki, A., Kaburaki, T., Akimitsu, N. Long non-coding RNAs involved in pathogenic infection. Frontiers in Genetics. 11, 454 (2020).
  6. Chandan, K., Gupta, M., Sarwat, M. Role of host and pathogen-derived microRNAs in immune regulation during infectious and inflammatory diseases. Frontiers in Immunology. 10, 3081 (2019).
  7. Chen, X., et al. Circular RNAs in immune responses and immune diseases. Theranostics. 9 (2), 588-607 (2019).
  8. Kristensen, L. S., et al. The biogenesis, biology and characterization of circular RNAs. Nature Reviews Genetics. 20 (11), 675-691 (2019).
  9. Ashwal-Fluss, R., et al. circRNA biogenesis competes with pre-mRNA splicing. Molecular Cell. 56 (1), 55-66 (2014).
  10. Conn, S. J., et al. The RNA binding protein quaking regulates formation of circRNAs. Cell. 160 (6), 1125-1134 (2015).
  11. Zhang, X. O., et al. Complementary sequence-mediated exon circularization. Cell. 159 (1), 134-147 (2014).
  12. Robic, A., Demars, J., Kuhn, C. In-depth analysis reveals production of circular RNAs from non-coding sequences. Cells. 9 (8), 1806 (2020).
  13. Eger, N., Schoppe, L., Schuster, S., Laufs, U., Boeckel, J. N. Circular RNA splicing. Advances in Experimental Medicine and Biology. 1087, 41-52 (2018).
  14. Barrett, S. P., Wang, P. L., Salzman, J. Circular RNA biogenesis can proceed through an exon-containing lariat precursor. eLife. 4, 07540 (2015).
  15. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  16. Misir, S., Wu, N., Yang, B. B. Specific expression and functions of circular RNAs. Cell Death and Differentiation. 29 (3), 481-491 (2022).
  17. Bai, S., et al. Construct a circRNA/miRNA/mRNA regulatory network to explore potential pathogenesis and therapy options of clear cell renal cell carcinoma. Scientific Reports. 10 (1), 13659 (2020).
  18. Sakshi, S., Jayasuriya, R., Ganesan, K., Xu, B., Ramkumar, K. M. Role of circRNA-miRNA-mRNA interaction network in diabetes and its associated complications. Molecular Therapy - Nucleic Acids. 26, 1291-1302 (2021).
  19. Hansen, T. B., et al. miRNA-dependent gene silencing involving Ago2-mediated cleavage of a circular antisense RNA. The EMBO Journal. 30 (21), 4414-4422 (2011).
  20. Lu, M. Circular RNA: functions, applications, and prospects. ExRNA. 2 (1), 15 (2020).
  21. Liu, K. S., Pan, F., Mao, X. D., Liu, C., Chen, Y. J. Biological functions of circular RNAs and their roles in occurrence of reproduction and gynecological diseases. American Journal of Translational Research. 11 (1), 1-15 (2019).
  22. Pamudurti, N. R., et al. Translation of CircRNAs. Molecular Cell. 66 (1), 9-21 (2017).
  23. Legnini, I., et al. Circ-ZNF609 Is a circular RNA that can be translated and functions in myogenesis. Molecular Cell. 66 (1), 22-37 (2017).
  24. Weigelt, C. M., et al. An insulin-sensitive circular RNA that regulates lifespan in Drosophila. Molecular Cell. 79 (2), 268-279 (2020).
  25. Guo, Y., et al. Identification and characterization of circular RNAs in the A549 cells following Influenza A virus infection. Veterinary Microbiology. 267, 109390 (2022).
  26. Qu, Z., et al. A novel intronic circular RNA antagonizes influenza virus by absorbing a microRNA that degrades CREBBP and accelerating IFN-β production. mBio. 12 (4), 0101721 (2021).
  27. Kawarada, Y., et al. TGF-β induces p53/Smads complex formation in the PAI-1 promoter to activate transcription. Scientific Reports. 6 (1), 35483 (2016).
  28. Yu, T., et al. Circular RNA GATAD2A promotes H1N1 replication through inhibiting autophagy. Veterinary Microbiology. 231, 238-245 (2019).
  29. FastQC: A quality control tool for high throughput sequence data. Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010)
  30. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  31. Zhang, J., Chen, S., Yang, J., Zhao, F. Accurate quantification of circular RNAs identifies extensive circular isoform switching events. Nature Communications. 11 (1), 90 (2020).
  32. Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
  33. Kim, D., Paggi, J. M., Park, C., Bennett, C., Salzberg, S. L. Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology. 37 (8), 907-915 (2019).
  34. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature Biotechnology. 33 (3), 290-295 (2015).
  35. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  36. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  37. Dori, M., Caroli, J., Forcato, M. Circr, a computational tool to identify miRNA:circRNA associations. Frontiers in Bioinformatics. 2, 852834 (2022).
  38. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Research. 13 (11), 2498-2504 (2003).
  39. Wu, T., et al. clusterProfiler 4.0: A universal enrichment tool for interpreting omics data. The Innovation. 2 (3), 100141 (2021).
  40. Yu, G., Wang, L. G., Han, Y., He, Q. Y. clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS: A Journal of Integrative Biology. 16 (5), 284-287 (2012).
  41. . org.Hs.eg.db: Genome wide annotation for human. 2022. R package version 3.15.0 Available from: https://bioconductor.org/packages/release/data/annotation/html/org.Hs.eg.db.html (2022)
  42. Barrett, T., et al. NCBI GEO: archive for functional genomics data sets-update. Nucleic Acids Research. 41, 991-995 (2012).
  43. Gao, Y., Zhang, J., Zhao, F. Circular RNA identification based on multiple seed matching. Briefings in Bioinformatics. 19 (5), 803-810 (2018).
  44. Zhang, X. O., et al. Diverse alternative back-splicing and alternative splicing landscape of circular RNAs. Genome Research. 26 (9), 1277-1287 (2016).
  45. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  46. Wang, K., et al. MapSplice: Accurate mapping of RNA-seq reads for splice junction discovery. Nucleic Acids Research. 38 (18), 178 (2010).
  47. Song, X., et al. Circular RNA profile in gliomas revealed by identification tool UROBORUS. Nucleic Acids Research. 44 (9), 87 (2016).
  48. Hansen, T. B. Improved circRNA identification by combining prediction algorithms. Frontiers in Cell and Developmental Biology. 6, 20 (2018).
  49. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: A bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  50. Ma, X. K., et al. CIRCexplorer3: A CLEAR pipeline for direct comparison of circular and linear RNA expression. Genomics Proteomics Bioinformatics. 17 (5), 511-521 (2019).
  51. Gaffo, E., Buratin, A., Dal Molin, A., Bortoluzzi, S. Sensitive, reliable and robust circRNA detection from RNA-seq with CirComPara2. Briefings in Bioinformatics. 23 (1), (2022).
  52. Glažar, P., Papavasileiou, P., Rajewsky, N. circBase: a database for circular RNAs. RNA. 20 (11), 1666-1670 (2014).
  53. Tan, S., et al. Circular RNA F-circEA-2a derived from EML4-ALK fusion gene promotes cell migration and invasion in non-small cell lung cancer. Molecular Cancer. 17 (1), 138 (2018).
  54. Guarnerio, J., et al. Oncogenic role of Fusion-circRNAs Derived from cancer-associated chromosomal translocations. Cell. 165 (2), 289-302 (2016).
  55. McGeary, S. E., et al. The biochemical basis of microRNA targeting efficacy. Science. 366 (6472), (2019).
  56. Enright, A. J., et al. MicroRNA targets in Drosophila. Genome Biology. 5 (1), 1 (2003).
  57. Rehmsmeier, M., Steffen, P., Hochsmann, M., Giegerich, R. Fast and effective prediction of microRNA/target duplexes. RNA. 10 (10), 1507-1517 (2004).
  58. Zhang, D., et al. AllEnricher: a comprehensive gene set function enrichment tool for both model and non-model species. BMC Bioinformatics. 21 (1), 106 (2020).
  59. Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10 (1), 1523 (2019).

Reimpresiones y Permisos

Solicitar permiso para reutilizar el texto o las figuras de este JoVE artículos

Solicitar permiso

Explorar más artículos

Retracci nN mero 188ARN circularcircRNAinteracci n hu sped pat geno

This article has been published

Video Coming Soon

JoVE Logo

Privacidad

Condiciones de uso

Políticas

Investigación

Educación

ACERCA DE JoVE

Copyright © 2025 MyJoVE Corporation. Todos los derechos reservados