Los ARN circulares desempeñan importantes funciones reguladoras en diferentes procesos biológicos. Este protocolo es adecuado para principiantes para llevar a cabo análisis circulares de ARN en el área de interacciones entre huéspedes y patógenos. Aquí reunimos algunas de las herramientas para crear un protocolo simplificado requerido para la predicción y cuantificación seguras de ARN, el enriquecimiento funcional seguro de ARN, el ARN seguro, la predicción de interacción de micro-ARN y las construcciones de redes de ARN CCE.
Este protocolo simplificado se puede aplicar a muestras clínicas para identificar ciertos candidatos, valores diagnósticos y pronósticos en un entorno de interacción entre el huésped y el patógeno. Espero que aquellos que no tienen conocimientos previos de programación tengan dificultades para hacer la fase inicial de esta técnica. Por lo tanto, aconsejaría aprender los conceptos básicos de los lenguajes de programación utilizados en esta técnica.
Creo que generalmente mirar cómo se aplica el lenguaje de programación es más informativo y más fácil de entender en comparación con la lectura sola. Para comenzar abra un terminal Linux y en el directorio del genoma de referencia del host ejecute los comandos bwa index y hisat2-build para indexar el genoma. Prepare un archivo de configuración yml que contenga el nombre del archivo, la ruta de acceso de las herramientas, la ruta a los archivos de referencia descargados y la ruta a los archivos de índice.
Especifique el tipo de biblioteca de los datos de la secuencia de ARN y ejecute la herramienta Ciriquant utilizando los parámetros predeterminados o manuales. Prepare un archivo de texto con una lista de datos que contenga los ID de los datos de la secuencia de ARN, la ruta a los archivos GTF generados por Ciriquant y la agrupación de los datos de la secuencia de ARN, ya sea un grupo de control o tratado. En el terminal Linux, ejecute prep_Ciriquant con un archivo de texto preparado como entrada.
Esta ejecución generará una lista de archivos. Prepare un segundo archivo de texto con una lista de datos que contengan los ID de secuencia de ARN y la ruta a su respectiva salida de enlace de cadena. El diseño del archivo debe ser similar al archivo de texto preparado previamente sin la ejecución de la columna de agrupación.
Ejecute prepde. py con este archivo de texto como entrada para generar los archivos de matriz de recuento de genes. Ejecute Ciri_DE_Replicate con el library_info.
CSV, circRNA_BSJ. CSV y gene_count_matrix. CSV como entrada para generar el circRNA_DE final.
TSV. Para filtrar y determinar el número de circRNAs expresados diferencialmente, o DE, abra el circRNA_DE. tsv con R o cualquier otro software de hoja de cálculo.
Descomprima y extraiga el contenido del archivo CircR después de descargarlo de la página de CircR GitHub utilizando el software correspondiente, como WinRar o 7-Zip. En un nuevo directorio donde se realizará el análisis. A continuación, instale las aplicaciones de software necesarias como SAMTools, miRanda, RNAhybrid y Pybedtools antes de realizar el análisis de miARN circRNA.
Indexar el archivo genómico de referencia del organismo de interés utilizando el comando SAMtools FAIDX y preparar un archivo de entrada que consiste en las coordenadas de los circRNAs DE de interés en un archivo de cama delimitado por pestañas. A continuación, ejecute Circr. py usando Python3.
Y como los argumentos especifican el archivo de entrada circRNA, el genoma más rápido del organismo de interés, la versión del genoma del organismo seleccionado, el número de hilos y el nombre del archivo de salida en la línea de comandos. Una vez que se completa el análisis Circr, el programa genera un archivo de interacción circRNA-miRNA en formato CSV. Prepare un archivo delimitado por tabulaciones que contenga los circRNAs de interés y su miRNA diana.
La primera columna consiste en el nombre circRNA. La segunda columna especifica el tipo de ARN de la primera columna. La tercera columna es el miARN objetivo.
Y la cuarta columna especifica el tipo de ARN de la tercera columna. Para construir el mapa de red de ceRNA, abra el software Cytoscape, navegue hasta archivo, importe, red desde archivo, seleccione el archivo preparado y cárguelo. Pulse el botón de estilo para cambiar el estilo visual de la red.
Luego presione la flecha en el lado derecho del color de relleno, elija el tipo para la columna, el mapeo discreto para el tipo de mapeo y seleccione el color deseado para cada tipo de ARN. Después de eso, navegue a la forma para cambiar la forma de los nodos y siga los pasos que se muestran anteriormente. Para la ontología génica y el análisis KEGG del gen parental de los circRNAs, asegúrese del perfilador de clústeres y la organización. Hs.eg.
Los paquetes de DB se han instalado en nuestro estudio. Importe la información de circRNA de DE en el espacio de trabajo de R Studio. Si el usuario desea convertir los nombres de genes parentales a otros formatos, como el entrezid, utilice una función como bidder.
Utilice el ID de gen como entrada y ejecute la ontología de genes y el análisis de enriquecimiento utilizando la función enrichGO dentro del perfil o paquete de clúster utilizando parámetros predeterminados. Finalmente, ejecute el análisis de enriquecimiento KEGG utilizando el ID de gen como entrada y la función enrichKEGG dentro del paquete de perfilador de clústeres. El gráfico de burbujas del análisis de enriquecimiento de ontología génica de los genes parentales DE circRNA se muestra en esta figura.
La proporción de genes en el eje x es el número de genes en esa lista de entrada asociada con un término de ontología génica dado dividido por el número total de genes en ese término. El tamaño del punto en la gráfica está representado por el valor de conteo, que es el número de genes en la lista de entrada asociada con un término de ontología génica dado. Cuanto mayor sea el tamaño de los puntos, mayor será el número de genes de entrada asociados con el término.
Los puntos en la gráfica están codificados por colores en función del valor pque se calcula comparando la frecuencia observada de un término de anotación con la frecuencia esperada por casualidad. El enriquecimiento es estadísticamente significativo y se representa en el gráfico de burbujas solo si el valor es inferior a 0,01. Aquí, los tres principales enriquecimientos para los procesos biológicos incluyen la biogénesis del complejo ribonucleoproteico, la respuesta al virus y la regulación de la respuesta a un estímulo biótico.
Mientras que para las funciones moleculares, solo la actividad catalítica que actúa sobre el ARN y la unión al ARN monocatenario se enriquecen estadísticamente. Para los componentes celulares, solo el complejo retromémero se enriquece estadísticamente. Esta imagen representativa muestra el análisis de enriquecimiento KEGG de los genes parentales DE circRNA en un diagrama de burbujas.
Solo dos términos KEGG se enriquecieron en este caso, la gripe A y las vías del ciclo de vida viral. Una de las cosas más importantes al intentar este procedimiento es asegurarse del tipo de rasgo correcto del conjunto de datos de circ de ARN que está utilizando al ejecutar una lesión. La tubería bioformativa proporcionada aquí ayuda a predecir los posibles ARN seculares y las anotaciones funcionales.
Sin embargo, seguirá siendo necesaria una verificación bien dirigida para proporcionar pruebas sólidas. Este protocolo permitirá a los investigadores descubrir ARN seguro y sus posibles funciones funcionales en los diferentes códigos e interacciones de patógenos, que pueden estudiar más a fondo.