O miRDeep2 pode ser usado para identificar com precisão microRNAs vegetais que são importantes reguladores transcricionais no desenvolvimento da planta e são cruciais para responder aos desafios ambientais. o miRDeep2 requer um tempo de execução significativamente curto e exibe um excelente desempenho tanto em sensibilidade quanto em precisão, especialmente para prever microRNA em plantas com um genoma grande. Falsos positivos e longo tempo de processamento são desafios na anotação de microRNA vegetal.
Adicionando uma nova estratégia de fielding, revisando o algoritmo de pontuação e integrando critérios rigorosos, o miRDeep2 pode superar esses problemas. A anotação de microRNA de alta confiança é fundamental para descobrir o papel do microRNA na regulação da função diversificada do genoma. A orientação passo a passo pode ser útil para anotadores de microRNA pela primeira vez.
Para pesquisadores experientes, o método é útil para entender as vantagens e os benefícios do uso do miRDeep2 em outras ferramentas. Para instalar o pacote miRDeep2, navegue até a página web miRDeep2 e busque os arquivos tarball. Em seguida, extraia todo o conteúdo do arquivo baixado em uma pasta e defina o caminho da pasta para o caminho.
Para testar o pipeline miRDeep2, baixe os dados de teste e a saída esperada contendo um arquivo de sequenciamento GSM formatado e um arquivo de genoma Arabidopsis thaliana e mova todos os arquivos baixados para o diretório de trabalho atual. Depois de extrair os arquivos de tarball comprimidos, construa o índice de referência do genoma arabidopsis e o índice de referência RNA não codificado. Uma pasta será gerada automaticamente no user_selected_folder contendo todos os arquivos e resultados intermediários.
O pipeline miRDeep2 pode então ser executado usando os dados de teste. Para verificar as saídas de teste, visualize o arquivo de saída delimitado da guia. A saída final das microRNAs previstas conterá colunas que indicam o ID do cromossomo, direção do fio, representação lê ID, ID precursor, localização miRNA madura, localização precursora, sequência madura e sequência precursora.
Em seguida, verifique o arquivo progress_log que fornece informações sobre as etapas finalizadas e os arquivos script_log e script_err que contêm saídas e avisos do programa. Antes de executar o pipeline, para garantir que as leituras de entrada sejam pré-processadas no formato adequado, remova os adaptadores das cinco e três extremidades principais das leituras de sequenciamento profundo e garanta que todos os identificadores FAST A sejam únicos. Cada identificador de sequência deve terminar com um subtante x e um inteiro indicando o número de cópia da sequência exata que foi recuperada nos conjuntos de dados de sequenciamento profundo.
Para garantir um identificador rápido exclusivo, inclua um número de execução no ID.To construir um índice de referência, se as sequências de genomas da espécie de interesse tiverem sido indexadas, baixe arquivos de índice Bowtie 2 do site iGenomes. Em seguida, construa um índice de RNA não codificador não-microRNA contendo as principais sequências de não codificação do RNA fam, incluindo RNA ribossômico, RNA de transferência, RNA nuclear pequeno e RNA nucleolar pequeno para filtrar sequências ruidosas de outros fragmentos de RNA não codificados. Para usar o miRDeep2 para detectar novas microRNAs a partir de dados de sequenciamento profundo, execute o script bash no pacote para iniciar o pipeline de análise.
O número de diferentes locais para onde uma leitura poderia ser mapeado, o número de incompatibilidade para executar Bowtie 2 e o limiar das leituras por milhão podem ser modificados conforme necessário. Para verificar as saídas do miRDeep2, visualize os dados no output_folder gerado automaticamente. Nesta análise representativa, o gasoduto de anotação miRDeep2 microRNA foi aplicado a 10 bibliotecas públicas de sequência sRNA de cinco espécies vegetais com um aumento gradual do tamanho do genoma, conforme indicado.
Para cada espécie, duas pequenas bibliotecas representativas de RNA de diferentes tecidos e suas sequências de genoma de índice são processadas como duas entradas. Usando métodos anteriores, o processamento do genoma poderia levar mais de 100 horas ou às vezes pararia no meio da análise devido ao comprimento do genoma. miRDeep2, no entanto, termine esses processos de previsão em um período de tempo significativamente menor de minutos para horas.
Para as duas RNAs arabidopsis sequenciadas usadas neste teste, o miRDeep2 teve melhor desempenho tanto na sensibilidade quanto na precisão em comparação com outras ferramentas. Certifique-se de que o índice de entrada do programa está correto. Por exemplo, use Bowtie apenas com um índice Bowtie e use uma grande opção de índice para genomas grandes.
Os alvos do microRNA resultante podem ser previstos usando dados de sequenciamento que podem fornecer insights sobre a função microRNA. Como o miRDeep2 pode ser usado para identificar com precisão e sensibilidade a maioria dos microRNAs em uma espécie vegetal específica, o papel da função microRNA como um todo pode ser estudado.