Entrar

É necessária uma assinatura da JoVE para visualizar este conteúdo. Faça login ou comece sua avaliação gratuita.

Neste Artigo

  • Resumo
  • Resumo
  • Introdução
  • Protocolo
  • Resultados
  • Discussão
  • Materiais
  • Referências
  • Reimpressões e Permissões

Resumo

Aqui, apresentamos um novo e totalmente automatizado pipeline de miRNA, mirMachine, que 1) pode identificar miRNAs conhecidos e novos com mais precisão e 2) é totalmente automatizado e disponível gratuitamente. Os usuários agora podem executar um script de envio curto para executar o pipeline mirMachine totalmente automatizado.

Resumo

De diferentes tipos de RNAs não codificantes, os microRNAs (miRNAs) têm estado indiscutivelmente no centro das atenções na última década. Como reguladores pós-transcricionais da expressão gênica, os miRNAs desempenham papéis-chave em várias vias celulares, incluindo o desenvolvimento e a resposta ao estresse a/biótico, como seca e doenças. Ter sequências genômicas de referência de alta qualidade permitiu a identificação e anotação de miRNAs em várias espécies de plantas, onde as sequências de miRNA são altamente conservadas. Como os processos computacionais de identificação e anotação de miRNA são principalmente processos propensos a erros, as previsões baseadas em homologia aumentam a precisão da previsão. Desenvolvemos e melhoramos o pipeline de anotação de miRNA, SUmir, na última década, que tem sido usado para vários genomas de plantas desde então.

Este estudo apresenta um novo pipeline de miRNA totalmente automatizado, mirMachine (Máquina de miRNA), (i) adicionando uma etapa de filtragem adicional nas previsões da estrutura secundária, (ii) tornando-o totalmente automatizado e (iii) introduzindo novas opções para prever miRNA conhecido com base em homologia ou novos miRNAs baseados em pequenas leituras de sequenciamento de RNA usando o pipeline anterior. O novo pipeline de miRNA, mirMachine, foi testado usando o Arabidopsis Information Resource, TAIR10, liberação do genoma Arabidopsis e o genoma de referência de trigo v2 do International Wheat Genome Sequencing Consortium (IWGSC).

Introdução

Os avanços nas tecnologias de sequenciamento de próxima geração ampliaram a compreensão das estruturas de RNA e dos elementos regulatórios, revelando RNAs não codificantes (ncRNAs) funcionalmente importantes. Dentre os diferentes tipos de ncRNAs, os microRNAs (miRNAs) constituem uma classe reguladora fundamental de pequenos RNAs com comprimento entre 19 e 24 nucleotídeos em plantas 1,2. Desde a descoberta do primeiro miRNA no nematoide Caenorhabditis elegans3, a presença e as funções dos miRNAs têm sido amplamente estudadas em genomas animais e vegetais, bem como4,5,6. Os miRNAs funcionam visando os mRNAs para clivagem ou repressão translacional7. Evidências acumuladas também mostraram que os miRNAs estão envolvidos em uma ampla gama de processos biológicos em plantas, incluindo crescimento e desenvolvimento8, autobiogênese9 e várias respostas bióticas e abióticas ao estresse10.

Em plantas, os miRNAs são inicialmente processados a partir de longos transcritos primários chamados pri-miRNAs11. Esses pri-miRNAs gerados pela RNA polimerase II dentro do núcleo são transcritos longos formando uma estrutura fold-back imperfeita12. Os pri-miRNAs mais tarde passam por um processo de clivagem para produzir precursores endógenos de fita simples (ss) de miRNAs chamados pré-miRNAs11. O pré-miRNA forma uma estrutura semelhante a um grampo de cabelo em que uma fita simples se dobra em uma estrutura de fita dupla para extirpar um duplex de miRNA (miRNA/miRNA*)13. A proteína tipo dícero corta ambas as cadeias do duplex miRNA/miRNA*, deixando 2-nucleotídeos 3'-saliências14,15. O duplex de miRNA é metilado no interior do núcleo, o que protege a extremidade 3' do miRNA da degradação e da atividade de uridilação16,17. Uma helicase desenrola o duplex de miRNA metilado após a exportação e expõe o miRNA maduro ao complexo silenciador induzido por RNA (RISC) no citosol18. Uma fita do duplex é o miRNA maduro incorporado ao RISC, enquanto a outra fita, o miRNA*, é degradada. O complexo miRNA-RISC liga-se à sequência alvo, levando à degradação do mRNA em caso de complementaridade total ou à repressão translacional em caso de complementaridade parcial13.

Com base nas características de expressão e biogênese, diretrizes para anotação de miRNA têm sido descritas15,19. Com as diretrizes definidas, Lucas e Budak desenvolveram o pipeline SUmir para realizar uma identificação de miRNA in silico baseada em homologia em plantas9. O pipeline da SUmir era composto por dois scripts: SUmirFind e SUmirFold. O SUmirFind realiza pesquisas de similaridade em conjuntos de dados de miRNA conhecidos por meio da triagem da ferramenta de pesquisa de alinhamento local básico (BLAST) do National Center for Biotechnology Information (NCBI) com parâmetros modificados para incluir acertos com apenas 2 ou menos incompatibilidades e evitar viés para acertos mais curtos (blastn-short -ungapped -penalty -1 -reward 1). O SUmirFold avalia a estrutura secundária das supostas sequências de miRNA a partir dos resultados do BLAST20 usando o UNAfold21. O SUmirFold diferencia os miRNAs de pequenos RNAs interferentes pela identificação das características da estrutura do hairpin. Além disso, diferencia os miRNAs de outros ssRNAs, como tRNA e rRNA, pelos parâmetros, índice mínimo de energia de dobra > 0,67 e conteúdo de GC de 24-71%. Este pipeline foi recentemente atualizado adicionando duas etapas adicionais para (i) aumentar a sensibilidade, (ii) aumentar a precisão da anotação e (iii) fornecer distribuição genômica dos genes de miRNA previstos22. Dada a alta conservação das sequências de miRNA23 das plantas, este pipeline foi originalmente projetado para a previsão de miRNA baseada em homologia. Novos miRNAs, no entanto, não puderam ser identificados com precisão com esta análise de bioinformática, pois dependiam fortemente da conservação de sequências de miRNAs entre espécies intimamente relacionadas.

Este artigo apresenta um novo e totalmente automatizado pipeline de miRNA, mirMachine que 1) pode identificar miRNAs conhecidos e novos com mais precisão (por exemplo, o pipeline agora usa novas previsões de miRNA baseadas em sRNA-seq, bem como identificação de miRNA baseada em homologia) e 2) é totalmente automatizado e disponível gratuitamente. Os resultados também incluíram as distribuições genômicas dos miRNAs previstos. O mirMachine foi testado para previsões baseadas em homologia e sRNA-seq em genomas de trigo e Arabidopsis . Embora inicialmente lançado como software livre, UNAfold tornou-se um software comercial na última década. Com esta atualização, a ferramenta de previsão de estrutura secundária foi trocada de UNAfold para RNAfold para que o mirMachine possa estar disponível gratuitamente. Os usuários agora podem executar um script de envio curto para executar o pipeline mirMachine totalmente automatizado (exemplos são fornecidos em https://github.com/hbusra/mirMachine.git).

Protocolo

1. Dependências e instalação de software

  1. Instale dependências de software de seu site doméstico ou usando conda.
    1. Baixe e instale o Perl, se ainda não estiver instalado, a partir de seu site inicial (https://www.perl.org/get.html).
      NOTA: Os resultados representados foram preditos usando Perl v5.32.0.
    2. Baixe o Blast+, um programa de alinhamento, de seu site (https://www.ncbi.nlm.nih.gov/books/NBK279671/) como executável e como código-fonte.
      NOTA: Os resultados representados foram preditos utilizando o BLAST 2.6.0+.
    3. Instale o pacote pré-compilado do RNAfold a partir do https://www.tbi.univie.ac.at/RNA/.
    4. Alternativamente, instale esses softwares usando o seguinte conda: i) conda install -c bioconda blast; ii) conda install -c bioconda viennarna.

2. A configuração e o teste do mirMachine

  1. Baixe a versão mais recente dos scripts mirMachine e do script de envio mirMachine do GitHub, https://github.com/hbusra/mirMachine.git e, em seguida, defina o caminho dos scripts para o PATH.
  2. Use os dados de teste fornecidos no GitHub para garantir que o mirMachine, juntamente com todas as suas dependências, tenha sido baixado corretamente.
  3. Execute o mirMachine nos dados de teste mostrados abaixo.
    bash mirMachine_submit.sh -f iwgsc_v2_chr5A.fasta -i mature_high_conf_v22_1.fa.filtered.fasta -n 10
    NOTA: Defina a opção -n como 10, pois os dados de teste contêm apenas um cromossomo do genoma do trigo. Nos padrões, a opção -n é definida como 20.
  4. Controle os arquivos de saída hairpins.tbl.out.tbl para os miRNAs maduros previstos, seus precursores previstos e suas localizações nos cromossomos.
  5. Verifique os arquivos de log para as saídas e avisos do programa.

3. Identificação de miRNA baseada em homologia

  1. Execute o mirMachine usando o script bash mostrado abaixo:
    bash mirMachine_submit.sh -f $genome_file -i $input_file -m $mismatches -n $number_of_hits
  2. Verifique os miRNAs previstos. Localize o arquivo de saída chamado $input_file.results.tbl.hairpins.tbl.out.tbl para os miRNAs previstos. Localize o arquivo de saída chamado $input_file.results.tbl.hairpins.fsa para as sequências FASTA pré-miRNA. Localize o arquivo de saída chamado $input_file.results.tbl.hairpins.log para o arquivo de log hairpin.

4. Nova identificação de miRNA

  1. Pré-processe os arquivos FASTQ sRNA-seq no formato FASTA adequado. Corte os adaptadores, se necessário. Não corte leituras de baixa qualidade; em vez disso, remova-os. Remova as leituras que contêm N. Converta o arquivo FASTQ em arquivo FASTA ($input_file).
  2. Execute o mirMachine usando o script bash mostrado abaixo.
    bash mirMachine_submit.sh -f $genome_file -i $input_file -n $number_of_hits -sRNAseq -lmax $lmax -lmin $lmin -rpm $rpm
    NOTA: $mismatches foi definido como 0 para previsões baseadas em sRNA-seq.
  3. Verifique os miRNAs previstos. Localize o arquivo de saída chamado $input_file.results.tbl.hairpins.tbl.out.tbl para os miRNAs previstos. Localize o arquivo de saída chamado $input_file.results.tbl.hairpins.fsa para as sequências FASTA pré-miRNA. Localize o arquivo de saída chamado $input_file.results.tbl.hairpins.log para o arquivo de log hairpin.

5. Parâmetros de avanço

NOTA: Os padrões são definidos para todos os parâmetros, exceto para o arquivo de genoma e o arquivo de miRNA de entrada.

  1. Defina a opção -db como um banco de dados de explosão para ignorar o banco de dados de referência de construção dentro do pipeline.
  2. Defina a opção -m para o número de incompatibilidades permitidas.
    NOTA: Nos padrões, a opção -m foi definida como 1 para previsões baseadas em homologia e 0 para as previsões baseadas em sRNA-seq.
  3. Defina o -n para o número de acertos a serem eliminados após o alinhamento (padrão para 20). Mude isso com base na espécie.
  4. Use o -long para avaliar as estruturas secundárias da lista de suspeitos.
  5. Use o -s para ativar a nova previsão de miRNA com base em dados de sRNA-seq .
  6. Defina a opção - lmax para o comprimento máximo das leituras de sRNA-seq a serem incluídas na triagem.
  7. Defina a opção - lmax para o comprimento mínimo das leituras de sRNA-seq a serem incluídas na triagem.
  8. Use a opção -rpm para definir o limite de leituras por milhão (RPM).
    NOTA: Para parâmetros avançados, como o comprimento dos pri-miRNAs/pré-miRNAs, os usuários experientes são encorajados a modificar os scripts para suas pesquisas de interesse. Além disso, se os usuários pretendem pular algumas etapas ou preferem usar saídas modificadas, o script de envio pode ser modificado simplesmente adicionando # no início das linhas para pular essas linhas.

Resultados

O pipeline de miRNA, mirMachine, descrito acima foi aplicado aos dados de teste para a rápida avaliação do desempenho do pipeline. Apenas os miRNAs vegetais de alta confiança depositados na miRBase v22.1 foram rastreados contra o cromossomo 5A do genoma RefSeq de trigo IWGSC v224. mirMachine_find retornou 312 acertos para a lista não redundante de 189 miRNAs de alta confiança com um máximo de 1 incompatibilidade permitida (Tabela 1). mirMachine_fold classificaram 49 deles c...

Discussão

Nosso pipeline de miRNA, SUmir, tem sido usado para a identificação de muitos miRNAs de plantas na última década. Aqui, desenvolvemos um novo pipeline de identificação e anotação de miRNA totalmente automatizado e disponível gratuitamente, o mirMachine. Além disso, vários pipelines de identificação de miRNA, incluindo, mas não se limitando ao pipeline anterior, dependiam do software UNAfold21, que se tornou um software comercial ao longo do tempo, embora uma vez estivesse disponível...

Materiais

NameCompanyCatalog NumberComments
https://www.ncbi.nlm.nih.gov/books/NBK279671/Blast+
https://github.com/hbusra/mirMachine.gitmirMachine submission script
https://www.perl.org/get.htmlPerl
https://www.tbi.univie.ac.at/RNA/RNAfold
Arabidopsis TAIR10
Triticum aestivum (wheat, IWGSC RefSeq v2)

Referências

  1. Voinnet, O. Origin, biogenesis, and activity of plant microRNAs. Cell. 136 (4), 669-687 (2009).
  2. Budak, H., Akpinar, B. A. Plant miRNAs: biogenesis, organization and origins. Functional & Integrative Genomics. 15 (5), 523-531 (2015).
  3. Lee, R. C., Feinbaum, R. L., Ambros, V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 75 (5), 843-854 (1993).
  4. Zhang, L., et al. Exogenous plant MIR168a specifically targets mammalian LDLRAP1: evidence of cross-kingdom regulation by microRNA. Cell Research. 22 (1), 107-126 (2012).
  5. Pang, K. C., Frith, M. C., Mattick, J. S. Rapid evolution of noncoding RNAs: Lack of conservation does not mean lack of function. Trends in Genetics. 22 (1), 1-5 (2006).
  6. Guleria, P., Mahajan, M., Bhardwaj, J., Yadav, S. K. Plant small RNAs: biogenesis, mode of action and their roles in abiotic stresses. Genomics, Proteomics and Bioinformatics. 9 (6), 183-199 (2011).
  7. Jones-Rhoades, M. W., Bartel, D. P., Bartel, B. MicroRNAs and their regulatory roles in plants. Annual Review of Plant Biology. 57, 19-53 (2006).
  8. Singh, A., et al. Plant small RNAs: advancement in the understanding of biogenesis and role in plant development. Planta. 248 (3), 545-558 (2018).
  9. Lucas, S. J., Budak, H. Sorting the wheat from the chaff: identifying miRNAs in genomic survey sequences of Triticum aestivum chromosome 1AL. PloS One. 7 (7), 40859 (2012).
  10. Li, S., Castillo-González, C., Yu, B., Zhang, X. The functions of plant small RNAs in development and in stress responses. Plant Journal. 90 (4), 654-670 (2017).
  11. Lee, Y., Jeon, K., Lee, J. T., Kim, S., Kim, V. N. MicroRNA maturation: Stepwise processing and subcellular localization. EMBO Journal. 21 (17), 4663-4670 (2002).
  12. Lee, Y., et al. MicroRNA genes are transcribed by RNA polymerase II. EMBO Journal. 23 (2), 4051-4060 (2004).
  13. Bartel, D. P. MicroRNAs: Genomics, biogenesis, mechanism, and function. Cell. 116 (2), 281-297 (2004).
  14. Lee, Y., et al. The nuclear RNase III Drosha initiates microRNA processing. Nature. 425 (6956), 415-419 (2003).
  15. Meyers, B. C., et al. Criteria for annotation of plant microRNAs. Plant Cell. 20 (12), 3186-3190 (2008).
  16. Sanei, M., Chen, X. Mechanisms of microRNA turnover. Current Opinion in Plant Biology. 27, 199-206 (2015).
  17. Li, J., Yang, Z., Yu, B., Liu, J., Chen, X. Methylation protects miRNAs and siRNAs from a 3′-end uridylation activity in Arabidopsis. Current Biology. 15 (16), 1501-1507 (2005).
  18. Rogers, K., Chen, X. Biogenesis, turnover, and mode of action of plant microRNAs. Plant Cell. 25 (7), 2383-2399 (2013).
  19. Axtell, M. J., Meyers, B. C. Revisiting criteria for plant microRNA annotation in the Era of big data. Plant Cell. 30 (2), 272-284 (2018).
  20. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10 (1), 421 (2009).
  21. Markham, N. R. N., Zuker, M. UNAFold: Software for nucleic acid folding and hybridization. Methods in Molecular Biology. 453, 3-31 (2008).
  22. Alptekin, B., Akpinar, B. A., Budak, H. A comprehensive prescription for plant miRNA identification. Frontiers in Plant Science. 7, 2058 (2017).
  23. Zhang, B., Pan, X., Cannon, C. H., Cobb, G. P., Anderson, T. A. Conservation and divergence of plant microRNA genes. Plant Journal. 46 (2), 243-259 (2006).
  24. Appels, R., et al. Shifting the limits in wheat research and breeding using a fully annotated reference genome. Science. 361 (6403), 7191 (2018).
  25. Wang, Y., Kuang, Z., Li, L., Yang, X. A bioinformatics pipeline to accurately and efficiently analyze the microRNA transcriptomes in plants. Journal of Visualized Experiments: JoVE. (155), e59864 (2020).
  26. Kozomara, A., Griffiths-Jones, S. MiRBase: Annotating high confidence microRNAs using deep sequencing data. Nucleic Acids Research. 42, 68-73 (2014).
  27. Lorenz, R., et al. ViennaRNA Package 2.0. Algorithms for Molecular Biology. 6 (1), 26 (2011).
  28. Wicker, T., et al. Impact of transposable elements on genome structure and evolution in bread wheat. Genome Biology. 19 (1), 103 (2018).
  29. Flavell, R. B., Bennett, M. D., Smith, J. B., Smith, D. B. Genome size and the proportion of repeated nucleotide sequence DNA in plants. Biochemical Genetics. 12 (4), 257-269 (1974).
  30. Wicker, T., et al. The repetitive landscape of the 5100 Mbp barley genome. Mobile DNA. 8, 22 (2017).
  31. Yang, Q., Ye, Q. A., Liu, Y. Mechanism of siRNA production from repetitive DNA. Genes and Development. 29 (5), 526-537 (2015).
  32. Lam, J. K. W., Chow, M. Y. T., Zhang, Y., Leung, S. W. S. siRNA versus miRNA as therapeutics for gene silencing. Molecular Therapy. Nucleic Acids. 4 (9), 252 (2015).
  33. Bartel, B. MicroRNAs directing siRNA biogenesis. Nature Structural and Molecular Biology. 12 (7), 569-571 (2005).
  34. Meng, Y., Shao, C., Wang, H., Chen, M. Are all the miRBase-registered microRNAs true? A structure- and expression-based re-examination in plants. RNA Biology. 9 (3), 249-253 (2012).
  35. Berezikov, E., et al. Evolutionary flux of canonical microRNAs and mirtrons in Drosophila. Nature Genetics. 42 (1), 6-9 (2010).

Reimpressões e Permissões

Solicitar permissão para reutilizar o texto ou figuras deste artigo JoVE

Solicitar Permissão

Explore Mais Artigos

BiologiaEdi o 171

This article has been published

Video Coming Soon

JoVE Logo

Privacidade

Termos de uso

Políticas

Pesquisa

Educação

SOBRE A JoVE

Copyright © 2025 MyJoVE Corporation. Todos os direitos reservados