É necessária uma assinatura da JoVE para visualizar este conteúdo. Faça login ou comece sua avaliação gratuita.
Aqui, apresentamos um novo e totalmente automatizado pipeline de miRNA, mirMachine, que 1) pode identificar miRNAs conhecidos e novos com mais precisão e 2) é totalmente automatizado e disponível gratuitamente. Os usuários agora podem executar um script de envio curto para executar o pipeline mirMachine totalmente automatizado.
De diferentes tipos de RNAs não codificantes, os microRNAs (miRNAs) têm estado indiscutivelmente no centro das atenções na última década. Como reguladores pós-transcricionais da expressão gênica, os miRNAs desempenham papéis-chave em várias vias celulares, incluindo o desenvolvimento e a resposta ao estresse a/biótico, como seca e doenças. Ter sequências genômicas de referência de alta qualidade permitiu a identificação e anotação de miRNAs em várias espécies de plantas, onde as sequências de miRNA são altamente conservadas. Como os processos computacionais de identificação e anotação de miRNA são principalmente processos propensos a erros, as previsões baseadas em homologia aumentam a precisão da previsão. Desenvolvemos e melhoramos o pipeline de anotação de miRNA, SUmir, na última década, que tem sido usado para vários genomas de plantas desde então.
Este estudo apresenta um novo pipeline de miRNA totalmente automatizado, mirMachine (Máquina de miRNA), (i) adicionando uma etapa de filtragem adicional nas previsões da estrutura secundária, (ii) tornando-o totalmente automatizado e (iii) introduzindo novas opções para prever miRNA conhecido com base em homologia ou novos miRNAs baseados em pequenas leituras de sequenciamento de RNA usando o pipeline anterior. O novo pipeline de miRNA, mirMachine, foi testado usando o Arabidopsis Information Resource, TAIR10, liberação do genoma Arabidopsis e o genoma de referência de trigo v2 do International Wheat Genome Sequencing Consortium (IWGSC).
Os avanços nas tecnologias de sequenciamento de próxima geração ampliaram a compreensão das estruturas de RNA e dos elementos regulatórios, revelando RNAs não codificantes (ncRNAs) funcionalmente importantes. Dentre os diferentes tipos de ncRNAs, os microRNAs (miRNAs) constituem uma classe reguladora fundamental de pequenos RNAs com comprimento entre 19 e 24 nucleotídeos em plantas 1,2. Desde a descoberta do primeiro miRNA no nematoide Caenorhabditis elegans3, a presença e as funções dos miRNAs têm sido amplamente estudadas em genomas animais e vegetais, bem como4,5,6. Os miRNAs funcionam visando os mRNAs para clivagem ou repressão translacional7. Evidências acumuladas também mostraram que os miRNAs estão envolvidos em uma ampla gama de processos biológicos em plantas, incluindo crescimento e desenvolvimento8, autobiogênese9 e várias respostas bióticas e abióticas ao estresse10.
Em plantas, os miRNAs são inicialmente processados a partir de longos transcritos primários chamados pri-miRNAs11. Esses pri-miRNAs gerados pela RNA polimerase II dentro do núcleo são transcritos longos formando uma estrutura fold-back imperfeita12. Os pri-miRNAs mais tarde passam por um processo de clivagem para produzir precursores endógenos de fita simples (ss) de miRNAs chamados pré-miRNAs11. O pré-miRNA forma uma estrutura semelhante a um grampo de cabelo em que uma fita simples se dobra em uma estrutura de fita dupla para extirpar um duplex de miRNA (miRNA/miRNA*)13. A proteína tipo dícero corta ambas as cadeias do duplex miRNA/miRNA*, deixando 2-nucleotídeos 3'-saliências14,15. O duplex de miRNA é metilado no interior do núcleo, o que protege a extremidade 3' do miRNA da degradação e da atividade de uridilação16,17. Uma helicase desenrola o duplex de miRNA metilado após a exportação e expõe o miRNA maduro ao complexo silenciador induzido por RNA (RISC) no citosol18. Uma fita do duplex é o miRNA maduro incorporado ao RISC, enquanto a outra fita, o miRNA*, é degradada. O complexo miRNA-RISC liga-se à sequência alvo, levando à degradação do mRNA em caso de complementaridade total ou à repressão translacional em caso de complementaridade parcial13.
Com base nas características de expressão e biogênese, diretrizes para anotação de miRNA têm sido descritas15,19. Com as diretrizes definidas, Lucas e Budak desenvolveram o pipeline SUmir para realizar uma identificação de miRNA in silico baseada em homologia em plantas9. O pipeline da SUmir era composto por dois scripts: SUmirFind e SUmirFold. O SUmirFind realiza pesquisas de similaridade em conjuntos de dados de miRNA conhecidos por meio da triagem da ferramenta de pesquisa de alinhamento local básico (BLAST) do National Center for Biotechnology Information (NCBI) com parâmetros modificados para incluir acertos com apenas 2 ou menos incompatibilidades e evitar viés para acertos mais curtos (blastn-short -ungapped -penalty -1 -reward 1). O SUmirFold avalia a estrutura secundária das supostas sequências de miRNA a partir dos resultados do BLAST20 usando o UNAfold21. O SUmirFold diferencia os miRNAs de pequenos RNAs interferentes pela identificação das características da estrutura do hairpin. Além disso, diferencia os miRNAs de outros ssRNAs, como tRNA e rRNA, pelos parâmetros, índice mínimo de energia de dobra > 0,67 e conteúdo de GC de 24-71%. Este pipeline foi recentemente atualizado adicionando duas etapas adicionais para (i) aumentar a sensibilidade, (ii) aumentar a precisão da anotação e (iii) fornecer distribuição genômica dos genes de miRNA previstos22. Dada a alta conservação das sequências de miRNA23 das plantas, este pipeline foi originalmente projetado para a previsão de miRNA baseada em homologia. Novos miRNAs, no entanto, não puderam ser identificados com precisão com esta análise de bioinformática, pois dependiam fortemente da conservação de sequências de miRNAs entre espécies intimamente relacionadas.
Este artigo apresenta um novo e totalmente automatizado pipeline de miRNA, mirMachine que 1) pode identificar miRNAs conhecidos e novos com mais precisão (por exemplo, o pipeline agora usa novas previsões de miRNA baseadas em sRNA-seq, bem como identificação de miRNA baseada em homologia) e 2) é totalmente automatizado e disponível gratuitamente. Os resultados também incluíram as distribuições genômicas dos miRNAs previstos. O mirMachine foi testado para previsões baseadas em homologia e sRNA-seq em genomas de trigo e Arabidopsis . Embora inicialmente lançado como software livre, UNAfold tornou-se um software comercial na última década. Com esta atualização, a ferramenta de previsão de estrutura secundária foi trocada de UNAfold para RNAfold para que o mirMachine possa estar disponível gratuitamente. Os usuários agora podem executar um script de envio curto para executar o pipeline mirMachine totalmente automatizado (exemplos são fornecidos em https://github.com/hbusra/mirMachine.git).
1. Dependências e instalação de software
2. A configuração e o teste do mirMachine
3. Identificação de miRNA baseada em homologia
4. Nova identificação de miRNA
5. Parâmetros de avanço
NOTA: Os padrões são definidos para todos os parâmetros, exceto para o arquivo de genoma e o arquivo de miRNA de entrada.
O pipeline de miRNA, mirMachine, descrito acima foi aplicado aos dados de teste para a rápida avaliação do desempenho do pipeline. Apenas os miRNAs vegetais de alta confiança depositados na miRBase v22.1 foram rastreados contra o cromossomo 5A do genoma RefSeq de trigo IWGSC v224. mirMachine_find retornou 312 acertos para a lista não redundante de 189 miRNAs de alta confiança com um máximo de 1 incompatibilidade permitida (Tabela 1). mirMachine_fold classificaram 49 deles c...
Nosso pipeline de miRNA, SUmir, tem sido usado para a identificação de muitos miRNAs de plantas na última década. Aqui, desenvolvemos um novo pipeline de identificação e anotação de miRNA totalmente automatizado e disponível gratuitamente, o mirMachine. Além disso, vários pipelines de identificação de miRNA, incluindo, mas não se limitando ao pipeline anterior, dependiam do software UNAfold21, que se tornou um software comercial ao longo do tempo, embora uma vez estivesse disponível...
Name | Company | Catalog Number | Comments |
https://www.ncbi.nlm.nih.gov/books/NBK279671/ | Blast+ | ||
https://github.com/hbusra/mirMachine.git | mirMachine submission script | ||
https://www.perl.org/get.html | Perl | ||
https://www.tbi.univie.ac.at/RNA/ | RNAfold | ||
Arabidopsis TAIR10 | |||
Triticum aestivum (wheat, IWGSC RefSeq v2) |
Solicitar permissão para reutilizar o texto ou figuras deste artigo JoVE
Solicitar PermissãoThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Todos os direitos reservados