L'identificazione computazionale dei micro RNA produce elevate previsioni false positive. Con i recenti aggiornamenti mirMachine fornisce un'elevata sensibilità e specificità nelle previsioni di micro RNA noti e nuovi. MirMachine ha dimostrato di essere superiore ai più recenti algoritmi di micro RNA in termini di sensibilità e mirMachine è ora completamente automatizzata e disponibile gratuitamente in modo che tutti possano usarla con le istruzioni fornite.
MirMachine può prevedere la distribuzione a livello di genoma dei presunti micro RNA senza limitazione dei dati specifici per tessuti e condizioni. La disponibilità dei dati preliminari prima dell'esperimento di sequenziamento dell'msRNA accelererebbe il processo di verifica per gli importanti geni del micro RNA. Prima di impostare la macchina, scaricare e installare le dipendenze software dai rispettivi siti home utilizzando i collegamenti nel testo manoscritto.
In alternativa, un modo più semplice e veloce per installare le dipendenze software consiste nell'utilizzare conduct utilizzando i comandi forniti nel testo manuscritto. Scarica l'ultima versione degli script mirMachine il semplice script di invio della macchina da GitHub. Quindi impostare il percorso degli script nella scheda percorso.
Assicurarsi che mirMachine e le relative dipendenze siano state scaricate correttamente eseguendo mirMachine sui dati di test da GitHub. Controllare lo stato del processo sullo schermo in base al flusso di output standard. Una volta visualizzato tutto il testo finito, controlla i file di output.
Controlla le forcine dot TBL dot out dot TBL output files. Notate le sequenze di miRNA pre miRNA maturi e miRNA sulla seconda, terza e sesta colonna. Trova la posizione dei miRNA previsti sui cromosomi alla fine di ogni riga.
Quindi controllare i file di registro per gli output e gli avvisi del programma. Per l'identificazione basata sull'omologia eseguire la mirMachine utilizzando lo script bash e controllare gli mRNA previsti. Trova il file di output per i miRNA maturi e le sequenze più veloci di pre miRNA, nonché il file di output per il file di log hairpin.
Per l'identificazione di nuovi miRNA, pre-elaborare i file sRNA-seq Fast Q nel formato FASTA corretto. Tagliare gli adattatori e rimuovere le letture di bassa qualità come quelle contenenti N poiché la pre-elaborazione per le letture sRNA-seq non fanno parte di mirMachine. Scegliere uno strumento di taglio stabile e parametri di taglio per i dati inviati.
Converti il file FASTQ in file FASTA come file di input. Se viene fornito un file di tabella di abbondanza, utilizzare lo script di modifica fornito con gli script mirMachine per convertire il file di tabella in un input FASTA corretto. Quindi eseguire la mirMachine utilizzando lo script bash.
Controlla i miRNA previsti. Trova il file di output per gli mRNA previsti e le sequenze FASTA di prem miRNA e il file di output per il file di log hairpin. Impostare l'opzione dash DB su un database blast per ignorare il database di riferimento dell'edificio all'interno della pipeline.
Imposta l'opzione M del trattino sul numero di mancate corrispondenze consentite e il trattino N sul numero di colpi da eliminare dopo l'allineamento. Cambia questo in base alla specie. Usa il trattino lungo per valutare le strutture secondarie per la lista sospetta e il trattino per attivare la nuova previsione del miRNA basata sui dati di sRNA-seq.
Impostare l'opzione dash L max sulla lunghezza massima delle letture S RNA-seq da includere nello screening e l'opzione dash L min sulla lunghezza minima delle letture sRNA-seq da avere nello screening. Utilizzare l'opzione RPM del trattino per impostare la soglia di letture per milione. Nell'analisi rappresentativa.
Viene visualizzata la distribuzione delle famiglie di mRNA dal cromosoma cinque A del grano IWGSC. Il gruppo di mRNA più rappresentato era miR9666 con 18 miRNA identificati. Prestazioni della mirMachine su Arabidopsis thaliana e specie di grano rispetto al miRDP2.
I confronti tra la sensibilità e il numero due positivi hanno mostrato che mirMachine ha sovraperformato miRDP2 sui dati di Arabidopsis. Per i dati sul grano la previsione basata sull'omologia di mirMachine con evidenza di espressione ha fornito una sensibilità migliore rispetto a miRDP2. Per entrambi i genomi miRDP2 ha predetto un numero maggiore di veri positivi rispetto alle previsioni basate su sRNA-seq e omologia.
L'impostazione dell'applicazione richiesta potrebbe essere onerosa per l'utente inesperto. Seguire questo video tutorial aiuterebbe. La visualizzazione del processo di installazione incoraggerà i ricercatori non computazionali ad entrare in alcuni computer di base.
Inoltre, indagare sui file di output nel video aiuterà sicuramente gli utenti a interpretare i loro risultati.