Die computergestützte Identifizierung von Mikro-RNAs liefert hohe falsch positive Vorhersagen. Mit den jüngsten Updates bietet mirMachine eine hohe Sensitivität und Spezifität in bekannten und neuartigen Mikro-RNA-Vorhersagen. MirMachine hat sich in Bezug auf die Empfindlichkeit als den neuesten Mikro-RNA-Algorithmen überlegen erwiesen und mirMachine ist jetzt voll automatisiert und frei verfügbar, so dass jeder es mit Anweisungen verwenden kann.
MirMachine kann die genomweite Verteilung der mutmaßlichen Mikro-RNAs vorhersagen, ohne die Daten spezifisch für Gewebe und Bedingungen einzuschränken. Die Verfügbarkeit der vorläufigen Daten vor dem msRNA-Sequenzierungsexperiment würde den Verifikationsprozess für die wichtigen Mikro-RNA-Gene beschleunigen. Bevor Sie die Maschine einrichten, laden Sie Softwareabhängigkeiten von den jeweiligen Home-Sites über die Links im Textmanuskript herunter und installieren Sie sie.
Alternativ ist eine einfachere und schnellere Möglichkeit, die Softwareabhängigkeiten zu installieren, die Verwendung von conduct mit den im Textmanuskript bereitgestellten Befehlen. Laden Sie die neueste Version der mirMachine-Skripte herunter, das reine Maschineneinreichungsskript von GitHub. Legen Sie dann den Skriptpfad auf der Registerkarte Pfad fest.
Stellen Sie sicher, dass die mirMachine und ihre Abhängigkeiten korrekt heruntergeladen wurden, indem Sie die mirMachine für Testdaten von GitHub ausführen. Überprüfen Sie den Auftragsstatus auf dem Bildschirm anhand des Standardausgabestreams. Sobald der fertige Text angezeigt wird, steuern Sie die Ausgabedateien.
Steuern Sie die Hairpins dot TBL dot out dot TBL Ausgabedateien. Beachten Sie die reife miRNA pre miRNA und die miRNAs Sternsequenzen in der zweiten, dritten und sechsten Spalte. Finden Sie die Position der vorhergesagten miRNAs auf den Chromosomen am Ende jeder Zeile.
Überprüfen Sie dann die Protokolldateien auf die Programmausgaben und Warnungen. Für die homologiebasierte Identifizierung führen Sie die mirMachine mit dem Bash-Skript aus und überprüfen Sie die vorhergesagten mRNAs. Suchen Sie die Ausgabedatei für die reifen miRNAs und prä-miRNA-schnellsten Sequenzen sowie die Ausgabedatei für die Haarnadel-Protokolldatei.
Für die neuartige miRNA-Identifizierung werden die sRNA-seq Fast Q-Dateien in das richtige FASTA-Format vorverarbeitet. Trimmen Sie die Adapter und entfernen Sie Lesevorgänge mit niedriger Qualität, wie sie N enthalten, da die Vorverarbeitung für die sRNA-seq-Lesevorgänge nicht Teil von mirMachine ist. Wählen Sie ein stabiles Trimmwerkzeug und Trimmparameter für die übermittelten Daten.
Konvertieren Sie die FASTQ-Datei in FASTA-Datei als Eingabedatei. Wenn eine Fülltabellendatei bereitgestellt wird, verwenden Sie das mit den mirMachine-Skripten bereitgestellte Änderungsskript, um die Tabellendatei in eine ordnungsgemäße FASTA-Eingabe zu konvertieren. Führen Sie dann die mirMachine mit dem Bash-Skript aus.
Überprüfen Sie die vorhergesagten miRNAs. Suchen Sie die Ausgabedatei für die vorhergesagten mRNAs und prem miRNA FASTA-Sequenzen und die Ausgabedatei für die Haarnadel-Protokolldatei. Setzen Sie die Dash-DB-Option auf eine Blast-Datenbank, um die Gebäudereferenzdatenbank innerhalb der Pipeline zu überspringen.
Setzen Sie die Option Strich M auf die Anzahl der zulässigen Abweichungen und den Strich N auf die Anzahl der Treffer, die nach der Ausrichtung eliminiert werden sollen. Ändern Sie dies basierend auf der Art. Verwenden Sie den Bindestrich long, um die sekundären Strukturen für die verdächtige Liste zu bewerten, und den Bindestrich, um die neuartige miRNA-Vorhersage basierend auf sRNA-seq-Daten zu aktivieren.
Setzen Sie die Option dash L max auf die maximale Länge der S-RNA-seq-Lesevorgänge, die in das Screening einbezogen werden sollen, und die Option dash L min auf die minimale Länge der sRNA-seq-Lesevorgänge, die im Screening enthalten sein sollen. Verwenden Sie die Option Dash RPM, um den Schwellenwert für Lesevorgänge pro Million festzulegen. In der repräsentativen Analyse.
Die Verteilung der mRNA-Familien von den Chromosomen fünf A des IWGSC-Weizens wird dargestellt. Die am höchsten vertretene Gruppe von mRNAs war miR9666 mit 18 identifizierten miRNAs. Leistung der mirMachine bei Arabidopsis thaliana und Weizenarten im Vergleich zur miRDP2.
Vergleiche der Sensitivität und der Nummer zwei der positiven Ergebnisse zeigten, dass mirMachine miRDP2 auf den Arabidopsis-Daten übertraf. Für die Weizendaten lieferte die auf mirMachine Homologie basierende Vorhersage mit Expressionsnachweisen eine bessere Sensitivität als miRDP2. Für beide Genome prognostizierte miRDP2 eine höhere Anzahl von True Positives als sRNAs-seq und homologiebasierte Vorhersagen.
Das Einrichten der erforderlichen Anwendung könnte für den unerfahrenen Benutzer mühsam sein. Das Folgen dieses Video-Tutorials würde helfen. Die Visualisierung des Installationsprozesses wird die nicht computergestützten Forscher ermutigen, in einige grundlegende Berechnungen einzusteigen.
Darüber hinaus wird die Untersuchung der Ausgabedateien im Video den Benutzern definitiv helfen, ihre Ergebnisse zu interpretieren.