A identificação computacional de micro RNA produz altas previsões de falsos positivos. Com as atualizações recentes, o mirMachine fornece alta sensibilidade e especificidade em previsões de micro RNA conhecidas e novas. O MirMachine provou ser superior aos algoritmos de micro RNA mais recentes em termos de sensibilidade e o mirMachine agora é totalmente automatizado e disponível gratuitamente para que todos possam usá-lo com as instruções fornecidas.
O MirMachine pode prever a distribuição genômica dos supostos micro RNAs sem limitação dos dados específicos para tecidos e condições. A disponibilidade dos dados preliminares antes do experimento de sequenciamento de msRNA aceleraria o processo de verificação dos importantes genes de micro RNA. Antes de configurar a máquina, baixe e instale dependências de software dos respectivos sites iniciais usando os links no manuscrito do texto.
Alternativamente, uma maneira mais fácil e rápida de instalar as dependências do software é usar a conduta usando os comandos fornecidos no manuscrito do texto. Baixe a versão mais recente dos scripts mirMachine, o mero script de envio de máquina do GitHub. Em seguida, defina o caminho dos scripts na guia caminho.
Certifique-se de que o mirMachine e suas dependências foram baixados corretamente executando o mirMachine em dados de teste do GitHub. Verifique o status do trabalho na tela pelo fluxo de saída padrão. Quando todo o texto concluído aparecer, controle os arquivos de saída.
Controle os hairpins dot TBL dot out dot TBL output files. Observe o miRNA maduro pré miRNA e as sequências estelares de miRNAs na segunda, terceira e sexta colunas. Encontre a localização dos miRNAs previstos nos cromossomos no final de cada linha.
Em seguida, verifique os arquivos de log para as saídas e avisos do programa. Para identificação baseada em homologia, execute o mirMachine usando o script bash e verifique os mRNAs previstos. Encontre o arquivo de saída para os miRNAs maduros e as sequências mais rápidas de pré-miRNA, bem como o arquivo de saída para o arquivo de log hairpin.
Para uma nova identificação de miRNA, pré-processe os arquivos Fast Q de sRNA-seq no formato FASTA adequado. Corte os adaptadores e remova leituras de baixa qualidade como as que contêm N, pois o pré-processamento para as leituras de sRNA-seq não fazem parte do mirMachine. Escolha uma ferramenta de corte estável e parâmetros de corte para os dados enviados.
Converta o arquivo FASTQ em arquivo FASTA como arquivo de entrada. Se um arquivo de tabela de abundância for fornecido, use o script de modificação fornecido com os scripts mirMachine para converter o arquivo de tabela em uma entrada FASTA adequada. Em seguida, execute o mirMachine usando o script bash.
Verifique os miRNAs previstos. Encontre o arquivo de saída para os mRNAs previstos e as sequências FASTA de miRNA prem e o arquivo de saída para o arquivo de log hairpin. Defina a opção de banco de dados de traço como um banco de dados de explosão para ignorar o banco de dados de referência de criação dentro do pipeline.
Defina a opção de traço M para o número de incompatibilidades permitidas e o traço N para o número de acertos a serem eliminados após o alinhamento. Mude isso com base na espécie. Use o traço longo para avaliar as estruturas secundárias para a lista de suspeitos e o traço para ativar a nova previsão de miRNA com base em dados de sRNA-seq.
Defina a opção traço L max para o comprimento máximo das leituras de RNA-seq S para incluir na triagem e a opção L min de traço para o comprimento mínimo das leituras de sRNA-seq a ter na triagem. Use a opção RPM de traço para definir o limite de leituras por milhão. Na análise representativa.
A distribuição das famílias de mRNA do cromossomo cinco A do trigo IWGSC é exibida. O grupo de mRNAs mais bem representado foi o miR9666 com 18 miRNAs identificados. Desempenho do mirMachine em espécies de Arabidopsis thaliana e trigo em comparação com o miRDP2.
Comparações da sensibilidade e do número dois positivos mostraram que o mirMachine superou o miRDP2 nos dados da Arabidopsis. Para os dados de trigo mirMachine predição baseada em homologia com evidência de expressão forneceu melhor sensibilidade do que miRDP2. Para ambos os genomas, o miRDP2 previu um número maior de verdadeiros positivos do que as previsões baseadas em sRNAs-seq e homologia.
Configurar o aplicativo necessário pode ser oneroso para o usuário inexperiente. Seguir este vídeo tutorial ajudaria. A visualização do processo de instalação incentivará os pesquisadores não computacionais a entrar em alguma computação básica.
Além disso, investigar os arquivos de saída no vídeo definitivamente ajudará os usuários a interpretar seus resultados.