miRDeep2 kann verwendet werden, um AnlagenmicroRNAs, die wichtige Transkriptionsregulatoren in der Pflanzenentwicklung sind und für die Bewältigung von Umweltherausforderungen entscheidend sind, genau zu identifizieren. miRDeep2 benötigt eine deutlich kurze Laufzeit und weist eine hervorragende Leistung sowohl in der Empfindlichkeit als auch in der Genauigkeit auf, insbesondere bei der Vorhersage von microRNA in Pflanzen mit einem großen Genom. Falsche Positivmeldungen und lange Verarbeitungszeit sind Herausforderungen in der pflanzlichen microRNA-Anmerkung.
Durch das Hinzufügen einer neuen Feldstrategie, die Überarbeitung des Bewertungsalgorithmus und die Integration strenger Kriterien kann miRDeep2 diese Probleme überwinden. Die hochkonfiver microRNA-Anmerkung ist von grundlegender Bedeutung für die Entdeckung der Rolle von microRNA bei der Regulierung der vielfältigen Funktion des Genoms. Schritt-für-Schritt-Anleitung kann für microRNA-Annotatoren zum ersten Mal hilfreich sein.
Für erfahrene Forscher ist die Methode nützlich, um die Vorteile und Vorteile der Verwendung von miRDeep2 gegenüber anderen Tools zu verstehen. Um das paket miRDeep2 zu installieren, navigieren Sie zur miRDeep2 Webseite und rufen Sie die tarball-Dateien ab. Extrahieren Sie dann den gesamten Inhalt der heruntergeladenen Datei in einen Ordner, und legen Sie den Ordnerpfad auf Pfad fest.
Um die miRDeep2-Pipeline zu testen, laden Sie die Testdaten und die erwartete Ausgabe herunter, die eine formatierte GSM-Sequenzierungsdatei und eine Arabidopsis thaliana Genomdatei enthält, und verschieben Sie alle heruntergeladenen Dateien in das aktuelle Arbeitsverzeichnis. Nach dem Extrahieren der komprimierten Tarball-Dateien erstellen Sie den Arabidopsis Genom-Referenzindex und den nicht kodierenden RNA-Referenzindex. Ein Ordner wird automatisch im user_selected_folder generiert, der alle Zwischendateien und Ergebnisse enthält.
Die miRDeep2-Pipeline kann dann mit den Testdaten ausgeführt werden. Um die Testausgaben zu überprüfen, zeigen Sie die durch Tabulator getrennte Ausgabedatei an. Die endgültige Ausgabe der vorhergesagten microRNAs wird Spalten enthalten, die die Chromosomen-ID, Strangrichtung, repräsentative Lese-ID, Vorläufer-ID, reife miRNA-Position, Vorläuferposition, reife Sequenz und Vorläufersequenz angeben.
Überprüfen Sie dann die progress_log Datei, die Informationen über die abgeschlossenen Schritte und die script_log und script_err Dateien enthält, die Programmausgaben und Warnungen enthalten. Um vor dem Ausführen der Pipeline sicherzustellen, dass die Eingabelesevorgänge in das richtige Format vorverarbeitet werden, entfernen Sie Adapter von den fünf und drei Primenden der Deep-Sequenzierungslesevorgänge, und stellen Sie sicher, dass alle FAST A-Bezeichner eindeutig sind. Jeder Sequenzbezeichner muss mit einem Unterstrich x und einer ganzzahligen Datei enden, die die Kopiernummer der genauen Sequenz angibt, die in den Deep-Sequenzierungs-Datasets abgerufen wurde.
Um eine eindeutige FAST A-Kennung zu gewährleisten, fügen Sie eine laufende Zahl in die ID.To einen Referenzindex zu erstellen, wenn die Genomsequenzen der Arten von Interesse indiziert wurden, laden Sie Bowtie 2 Indexdateien von der iGenomes-Website herunter. Als nächstes erstellen Sie einen nicht-mikroRNA-nichtkodierenden RNA-Index, der die wichtigsten nichtkodierenden Sequenzen aus RNA-Fam enthält, einschließlich ribosomaler RNA, Transfer-RNA, kleiner kernatischer RNA und kleiner Nukleolar-RNA, um laute Sequenzen aus anderen nicht kodierenden RNA-Fragmenten herauszufiltern. Um miRDeep2 zum Erkennen neuer microRNAs aus deep sequencing-Daten zu verwenden, führen Sie das Bash-Skript im Paket aus, um die Analysepipeline zu starten.
Die Anzahl der verschiedenen Speicherorte, denen ein Leseort zugeordnet werden kann, die Nichtübereinstimmungsnummer für das Ausführen von Bowtie 2 und der Schwellenwert für die Lesevorgänge pro Million können bei Bedarf geändert werden. Um die miRDeep2-Ausgänge zu überprüfen, zeigen Sie die Daten in der automatisch generierten output_folder an. In dieser repräsentativen Analyse wurde die miRDeep2 microRNA-Anmerkungspipeline auf 10 öffentliche sRNA-Sequenzbibliotheken von fünf Pflanzenarten mit einer allmählich erhöhten Genomgröße angewendet, wie angegeben.
Für jede Spezies werden zwei repräsentative kleine RNA-Bibliotheken aus unterschiedlichen Geweben und ihre Indexgenomsequenzen als zwei Eingänge verarbeitet. Mit früheren Methoden konnte die Genomverarbeitung mehr als 100 Stunden dauern oder aufgrund der Länge des Genoms manchmal mitten in der Analyse zum Stillstand kommen. miRDeep2 beendet diese Vorhersageprozesse jedoch in einem deutlich kürzeren Zeitraum von Minuten bis Stunden.
Für die beiden sequenzierten Arabidopsis kleinen RNAs, die in diesem Test verwendet werden, schnitt miRDeep2 sowohl in bezug auf Empfindlichkeit und Genauigkeit als auch in anderen Werkzeugen besser ab. Stellen Sie sicher, dass der Eingabeindex für das Programm korrekt ist. Verwenden Sie beispielsweise Bowtie nur mit einem Bowtie-Index und eine große Indexoption für große Genome.
Die Ziele der resultierenden microRNA können mithilfe von Sequenzierungsdaten vorhergesagt werden, die Einblicke in die microRNA-Funktion liefern können. Da miRDeep2 verwendet werden kann, um die meisten microRNA in einer bestimmten Pflanzenart genau und sensibel zu identifizieren, kann die Rolle der microRNA-Funktion als Ganzes untersucht werden.