JoVE Logo

Iniciar sesión

Se requiere una suscripción a JoVE para ver este contenido. Inicie sesión o comience su prueba gratuita.

En este artículo

  • Resumen
  • Resumen
  • Introducción
  • Protocolo
  • Resultados
  • Discusión
  • Materiales
  • Referencias
  • Reimpresiones y Permisos

Resumen

Aquí, presentamos una nueva y totalmente automatizada tubería de miARN, mirMachine que 1) puede identificar miARN conocidos y novedosos con mayor precisión y 2) está totalmente automatizada y disponible gratuitamente. Los usuarios ahora pueden ejecutar un breve script de envío para ejecutar la canalización mirMachine totalmente automatizada.

Resumen

De los diferentes tipos de ARN no codificantes, los microARN (miARN) han estado en el centro de atención durante la última década. Como reguladores post-transcripcionales de la expresión génica, los miRNAs juegan un papel clave en varias vías celulares, incluyendo tanto el desarrollo como la respuesta al estrés biótico, como la sequía y las enfermedades. Tener secuencias genómicas de referencia de alta calidad permitió la identificación y anotación de miARN en varias especies de plantas, donde las secuencias de miARN están altamente conservadas. Como los procesos computacionales de identificación y anotación de miARN son en su mayoría procesos propensos a errores, las predicciones basadas en homología aumentan la precisión de la predicción. Desarrollamos y hemos mejorado la línea de anotación de miARN, SUmir, en la última década, que se ha utilizado para varios genomas de plantas desde entonces.

Este estudio presenta una nueva tubería de miARN totalmente automatizada, mirMachine (miRNA Machine), (i) agregando un paso de filtrado adicional en las predicciones de la estructura secundaria, (ii) haciéndolo completamente automatizado, y (iii) introduciendo nuevas opciones para predecir miARN conocidos basados en homología o nuevos miARN basados en pequeñas lecturas de secuenciación de ARN utilizando la tubería anterior. La nueva tubería de miARN, mirMachine, se probó utilizando The Arabidopsis Information Resource, TAIR10, liberación del genoma de Arabidopsis y el genoma de referencia de trigo v2 del Consorcio Internacional de Secuenciación del Genoma del Genoma del Trigo (IWGSC).

Introducción

Los avances en las tecnologías de secuenciación de próxima generación han ampliado la comprensión de las estructuras de ARN y los elementos reguladores, revelando ARN no codificantes (ncRNA) funcionalmente importantes. Entre los diferentes tipos de ncRNAs, los microRNAs (miRNAs) constituyen una clase reguladora fundamental de pequeños RNAs con una longitud entre 19 y 24 nucleótidos en plantas 1,2. Desde el descubrimiento del primer miARN en el nematodo Caenorhabditis elegans3, la presencia y las funciones de los miARN se han estudiado ampliamente en genomas animales y vegetales, así comoen 4,5,6. Los miARN funcionan dirigiéndose a los ARNm para la escisión o la represión traslacional7. La evidencia acumulada también ha demostrado que los miARN están involucrados en una amplia gama de procesos biológicos en las plantas, incluyendo el crecimiento y el desarrollo8, la autobiogénesis9 y varias respuestas de estrés biótico y abiótico10.

En las plantas, los miARN se procesan inicialmente a partir de transcripciones primarias largas llamadas pri-miARN11. Estos pri-miRNAs generados por la ARN polimerasa II dentro del núcleo son transcripciones largas que forman una estructura imperfecta de pliegue hacia atrás12. Los pri-miRNAs luego se someten a un proceso de escisión para producir precursores endógenos de horquilla monocatenaria (ss) de miRNAs llamados pre-miRNAs11. El pre-miARN forma una estructura similar a una horquilla en la que una sola hebra se pliega en una estructura de doble cadena para extirpar un miARN dúplex (miARN / miARN *)13. La proteína tipo Dicer corta ambas hebras del dúplex miRNA/miRNA*, dejando voladizos de 2-nucleótidos 3'-14,15. El miARN dúplex está metilado dentro del núcleo, lo que protege el extremo 3' del miARN de la degradación y la actividad de uridilación16,17. Una helicasa desenrolla el miARN dúplex metilado después de la exportación y expone el miARN maduro al complejo de silenciamiento inducido por ARN (RISC) en el citosol18. Una hebra del dúplex es miARN maduro incorporado en RISC, mientras que la otra hebra, miARN*, se degrada. El complejo miRNA-RISC se une a la secuencia diana, lo que conduce a la degradación del ARNm en caso de complementariedad completa o a la represión traslacional en caso de complementariedad parcial13.

Con base en las características de expresión y biogénesis, se han descrito directrices para la anotación de miARN15,19. Con las directrices definidas, Lucas y Budak desarrollaron el pipeline SUmir para realizar una identificación in silico de miRNA basada en homología en plantas9. La canalización de SUmir estaba compuesta por dos scripts: SUmirFind y SUmirFold. SUmirFind realiza búsquedas de similitud contra conjuntos de datos de miARN conocidos a través de la herramienta de búsqueda básica de alineación local (BLAST) del Centro Nacional de Información Biotecnológica (NCBI) con parámetros modificados para incluir aciertos con solo 2 o menos desajustes y para evitar el sesgo hacia golpes más cortos (blastn-short -ungapped -penalty -1 -reward 1). SUmirFold evalúa la estructura secundaria de las supuestas secuencias de miARN a partir de los resultados de BLAST20 utilizando UNAfold21. SUmirFold diferencia los miRNAs de los pequeños RNAs interferentes mediante la identificación de las características de la estructura de horquilla. Además, diferencia los miRNAs de otros ssRNAs como tRNA y rRNA por los parámetros, el índice mínimo de energía de pliegue > 0.67 y el contenido de GC de 24-71%. Esta tubería se ha actualizado recientemente agregando dos pasos adicionales para (i) aumentar la sensibilidad, (ii) aumentar la precisión de la anotación y (iii) proporcionar la distribución genómica de los genes de miARN predichos22. Dada la alta conservación de las secuencias de miARN de plantas23, esta tubería fue diseñada originalmente para la predicción de miARN basada en homología. Sin embargo, los nuevos miARN no pudieron identificarse con precisión con este análisis bioinformático, ya que dependía en gran medida de la conservación de secuencias de miARN entre especies estrechamente relacionadas.

Este documento presenta una nueva y totalmente automatizada tubería de miARN, mirMachine que 1) puede identificar miARN conocidos y nuevos con mayor precisión (por ejemplo, la tubería ahora utiliza predicciones novedosas de miARN basadas en sRNA-seq, así como la identificación de miARN basada en homología) y 2) está totalmente automatizado y disponible gratuitamente. Los resultados también han incluido las distribuciones genómicas de los miRNAs predichos. mirMachine se probó para predicciones basadas en homología y basadas en sRNA-seq en genomas de trigo y Arabidopsis . Aunque inicialmente se lanzó como software libre, UNAfold se convirtió en un software comercial en la última década. Con esta actualización, la herramienta de predicción de estructura secundaria se cambió de UNAfold a RNAfold para que mirMachine pueda estar disponible gratuitamente. Los usuarios ahora pueden ejecutar un script de envío corto para ejecutar la canalización mirMachine totalmente automatizada (se proporcionan ejemplos en https://github.com/hbusra/mirMachine.git).

Protocolo

1. Dependencias e instalación de software

  1. Instale dependencias de software desde su sitio de inicio o usando conda.
    1. Descargue e instale Perl, si aún no está instalado, desde su sitio de inicio (https://www.perl.org/get.html).
      NOTA: Los resultados representados se predijeron utilizando Perl v5.32.0.
    2. Descargue Blast+, un programa de alineación, desde su sitio principal (https://www.ncbi.nlm.nih.gov/books/NBK279671/) como ejecutable y como código fuente.
      NOTA: Los resultados representados se predijeron utilizando BLAST 2.6.0+.
    3. Instale el paquete precompilado de RNAfold desde https://www.tbi.univie.ac.at/RNA/.
    4. Alternativamente, instale estos softwares usando la siguiente conda: i) conda install -c bioconda blast; ii) conda install -c bioconda viennarna.

2. La configuración y prueba de mirMachine

  1. Descargue la versión más reciente de los scripts mirMachine y el script de envío mirMachine desde GitHub, https://github.com/hbusra/mirMachine.git y, a continuación, establezca la ruta de los scripts en la ruta de acceso.
  2. Utilice los datos de prueba proporcionados en el GitHub para asegurarse de que mirMachine junto con todas sus dependencias se hayan descargado correctamente.
  3. Ejecute mirMachine en los datos de prueba que se muestran a continuación.
    bash mirMachine_submit.sh -f iwgsc_v2_chr5A.fasta -i mature_high_conf_v22_1.fa.filtered.fasta -n 10
    NOTA: Establezca la opción -n en 10 ya que los datos de prueba contienen solo un cromosoma del genoma del trigo. De forma predeterminada, la opción -n se establece en 20.
  4. Controle los archivos de salida hairpins.tbl.out.tbl para los miARN maduros predichos, sus precursores previstos y sus ubicaciones en los cromosomas.
  5. Compruebe los archivos de registro para las salidas y advertencias del programa.

3. Identificación de miARN basada en homología

  1. Ejecute mirMachine utilizando el script bash que se muestra a continuación:
    bash mirMachine_submit.sh -f $genome_file -i $input_file -m $mismatches -n $number_of_hits
  2. Compruebe los miRNAs predichos. Busque el archivo de salida denominado $input_file.results.tbl.hairpins.tbl.out.tbl para los miRNAs predichos. Busque el archivo de salida denominado $input_file.results.tbl.hairpins.fsa para las secuencias FASTA pre-miRNA. Busque el archivo de salida denominado $input_file.results.tbl.hairpins.log para el archivo de registro de horquilla.

4. Nueva identificación de miARN

  1. Preprocese los archivos sRNA-seq FASTQ en el formato FASTA adecuado. Recorte los adaptadores si es necesario. No recorte lecturas de baja calidad; en su lugar, elimínelos. Elimine las lecturas que contengan N. Convierta el archivo FASTQ en un archivo FASTA ($input_file).
  2. Ejecute mirMachine utilizando el script bash que se muestra a continuación.
    bash mirMachine_submit.sh -f $genome_file -i $input_file -n $number_of_hits -sRNAseq -lmax $lmax -lmin $lmin -rpm $rpm
    NOTA: $mismatches se estableció en 0 para las predicciones basadas en sRNA-seq.
  3. Compruebe los miRNAs predichos. Busque el archivo de salida denominado $input_file.results.tbl.hairpins.tbl.out.tbl para los miRNAs predichos. Busque el archivo de salida denominado $input_file.results.tbl.hairpins.fsa para las secuencias FASTA pre-miRNA. Busque el archivo de salida denominado $input_file.results.tbl.hairpins.log para el archivo de registro de horquilla.

5. Parámetros avanzados

NOTA: Los valores predeterminados se definen para todos los parámetros excepto para el archivo del genoma y el archivo miRNA de entrada.

  1. Establezca la opción -db en una base de datos de explosión para omitir la base de datos de referencia de construcción dentro de la canalización.
  2. Establezca la opción -m en el número de discrepancias permitidas.
    NOTA: En los valores predeterminados, la opción - m se estableció en 1 para las predicciones basadas en homología y 0 para las predicciones basadas en sRNA-seq.
  3. Establezca el -n en el número de aciertos que desea eliminar después de la alineación (el valor predeterminado es 20). Cambie esto según la especie.
  4. Utilice - long para evaluar las estructuras secundarias de la lista de sospechosos.
  5. Utilice la - s para activar la nueva predicción de miARN basada en datos de sRNA-seq.
  6. Establezca la opción - lmax en la longitud máxima de las lecturas de sRNA-seq para incluir en el cribado.
  7. Establezca la opción - lmax en la longitud mínima de las lecturas de sRNA-seq para incluir en el cribado.
  8. Utilice la opción -rpm para establecer el umbral de lecturas por millón (RPM).
    NOTA: Para parámetros avanzados como la longitud de pri-miRNAs/pre-miRNAs, se anima a los usuarios experimentados a modificar los scripts para su investigación de interés. Además, si los usuarios tienen la intención de omitir algunos pasos o prefieren usar salidas modificadas, el script de envío se puede modificar simplemente agregando # al principio de las líneas para omitir esas líneas.

Resultados

La tubería de miARN, mirMachine, descrita anteriormente se aplicó a los datos de prueba para la evaluación rápida del rendimiento de la tubería. Solo los miARN vegetales de alta confianza depositados en miRBasa v22.1 se examinaron contra el cromosoma 5A del genoma RefSeq v224 del trigo IWGSC. mirMachine_find devolvió 312 aciertos para la lista no redundante de 189 miARN de alta confianza con un máximo de 1 desajuste permitido (Tabla 1). mirMachine_fold clasificado 49 de ell...

Discusión

Nuestra línea de miARN, SUmir, se ha utilizado para la identificación de muchos miARN de plantas durante la última década. Aquí, desarrollamos una nueva tubería de identificación y anotación de miARN totalmente automatizada y disponible gratuitamente, mirMachine. Además, varias tuberías de identificación de miARN, incluida, entre otras, la tubería anterior, dependían del software UNAfold21, que se convirtió en un software comercial con el tiempo, aunque una vez estuvo disponible grat...

Materiales

NameCompanyCatalog NumberComments
https://www.ncbi.nlm.nih.gov/books/NBK279671/Blast+
https://github.com/hbusra/mirMachine.gitmirMachine submission script
https://www.perl.org/get.htmlPerl
https://www.tbi.univie.ac.at/RNA/RNAfold
Arabidopsis TAIR10
Triticum aestivum (wheat, IWGSC RefSeq v2)

Referencias

  1. Voinnet, O. Origin, biogenesis, and activity of plant microRNAs. Cell. 136 (4), 669-687 (2009).
  2. Budak, H., Akpinar, B. A. Plant miRNAs: biogenesis, organization and origins. Functional & Integrative Genomics. 15 (5), 523-531 (2015).
  3. Lee, R. C., Feinbaum, R. L., Ambros, V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 75 (5), 843-854 (1993).
  4. Zhang, L., et al. Exogenous plant MIR168a specifically targets mammalian LDLRAP1: evidence of cross-kingdom regulation by microRNA. Cell Research. 22 (1), 107-126 (2012).
  5. Pang, K. C., Frith, M. C., Mattick, J. S. Rapid evolution of noncoding RNAs: Lack of conservation does not mean lack of function. Trends in Genetics. 22 (1), 1-5 (2006).
  6. Guleria, P., Mahajan, M., Bhardwaj, J., Yadav, S. K. Plant small RNAs: biogenesis, mode of action and their roles in abiotic stresses. Genomics, Proteomics and Bioinformatics. 9 (6), 183-199 (2011).
  7. Jones-Rhoades, M. W., Bartel, D. P., Bartel, B. MicroRNAs and their regulatory roles in plants. Annual Review of Plant Biology. 57, 19-53 (2006).
  8. Singh, A., et al. Plant small RNAs: advancement in the understanding of biogenesis and role in plant development. Planta. 248 (3), 545-558 (2018).
  9. Lucas, S. J., Budak, H. Sorting the wheat from the chaff: identifying miRNAs in genomic survey sequences of Triticum aestivum chromosome 1AL. PloS One. 7 (7), 40859 (2012).
  10. Li, S., Castillo-González, C., Yu, B., Zhang, X. The functions of plant small RNAs in development and in stress responses. Plant Journal. 90 (4), 654-670 (2017).
  11. Lee, Y., Jeon, K., Lee, J. T., Kim, S., Kim, V. N. MicroRNA maturation: Stepwise processing and subcellular localization. EMBO Journal. 21 (17), 4663-4670 (2002).
  12. Lee, Y., et al. MicroRNA genes are transcribed by RNA polymerase II. EMBO Journal. 23 (2), 4051-4060 (2004).
  13. Bartel, D. P. MicroRNAs: Genomics, biogenesis, mechanism, and function. Cell. 116 (2), 281-297 (2004).
  14. Lee, Y., et al. The nuclear RNase III Drosha initiates microRNA processing. Nature. 425 (6956), 415-419 (2003).
  15. Meyers, B. C., et al. Criteria for annotation of plant microRNAs. Plant Cell. 20 (12), 3186-3190 (2008).
  16. Sanei, M., Chen, X. Mechanisms of microRNA turnover. Current Opinion in Plant Biology. 27, 199-206 (2015).
  17. Li, J., Yang, Z., Yu, B., Liu, J., Chen, X. Methylation protects miRNAs and siRNAs from a 3′-end uridylation activity in Arabidopsis. Current Biology. 15 (16), 1501-1507 (2005).
  18. Rogers, K., Chen, X. Biogenesis, turnover, and mode of action of plant microRNAs. Plant Cell. 25 (7), 2383-2399 (2013).
  19. Axtell, M. J., Meyers, B. C. Revisiting criteria for plant microRNA annotation in the Era of big data. Plant Cell. 30 (2), 272-284 (2018).
  20. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10 (1), 421 (2009).
  21. Markham, N. R. N., Zuker, M. UNAFold: Software for nucleic acid folding and hybridization. Methods in Molecular Biology. 453, 3-31 (2008).
  22. Alptekin, B., Akpinar, B. A., Budak, H. A comprehensive prescription for plant miRNA identification. Frontiers in Plant Science. 7, 2058 (2017).
  23. Zhang, B., Pan, X., Cannon, C. H., Cobb, G. P., Anderson, T. A. Conservation and divergence of plant microRNA genes. Plant Journal. 46 (2), 243-259 (2006).
  24. Appels, R., et al. Shifting the limits in wheat research and breeding using a fully annotated reference genome. Science. 361 (6403), 7191 (2018).
  25. Wang, Y., Kuang, Z., Li, L., Yang, X. A bioinformatics pipeline to accurately and efficiently analyze the microRNA transcriptomes in plants. Journal of Visualized Experiments: JoVE. (155), e59864 (2020).
  26. Kozomara, A., Griffiths-Jones, S. MiRBase: Annotating high confidence microRNAs using deep sequencing data. Nucleic Acids Research. 42, 68-73 (2014).
  27. Lorenz, R., et al. ViennaRNA Package 2.0. Algorithms for Molecular Biology. 6 (1), 26 (2011).
  28. Wicker, T., et al. Impact of transposable elements on genome structure and evolution in bread wheat. Genome Biology. 19 (1), 103 (2018).
  29. Flavell, R. B., Bennett, M. D., Smith, J. B., Smith, D. B. Genome size and the proportion of repeated nucleotide sequence DNA in plants. Biochemical Genetics. 12 (4), 257-269 (1974).
  30. Wicker, T., et al. The repetitive landscape of the 5100 Mbp barley genome. Mobile DNA. 8, 22 (2017).
  31. Yang, Q., Ye, Q. A., Liu, Y. Mechanism of siRNA production from repetitive DNA. Genes and Development. 29 (5), 526-537 (2015).
  32. Lam, J. K. W., Chow, M. Y. T., Zhang, Y., Leung, S. W. S. siRNA versus miRNA as therapeutics for gene silencing. Molecular Therapy. Nucleic Acids. 4 (9), 252 (2015).
  33. Bartel, B. MicroRNAs directing siRNA biogenesis. Nature Structural and Molecular Biology. 12 (7), 569-571 (2005).
  34. Meng, Y., Shao, C., Wang, H., Chen, M. Are all the miRBase-registered microRNAs true? A structure- and expression-based re-examination in plants. RNA Biology. 9 (3), 249-253 (2012).
  35. Berezikov, E., et al. Evolutionary flux of canonical microRNAs and mirtrons in Drosophila. Nature Genetics. 42 (1), 6-9 (2010).

Reimpresiones y Permisos

Solicitar permiso para reutilizar el texto o las figuras de este JoVE artículos

Solicitar permiso

Explorar más artículos

Biolog aN mero 171

This article has been published

Video Coming Soon

JoVE Logo

Privacidad

Condiciones de uso

Políticas

Investigación

Educación

ACERCA DE JoVE

Copyright © 2025 MyJoVE Corporation. Todos los derechos reservados