JoVE Logo

Anmelden

Zum Anzeigen dieser Inhalte ist ein JoVE-Abonnement erforderlich. Melden Sie sich an oder starten Sie Ihre kostenlose Testversion.

In diesem Artikel

  • Zusammenfassung
  • Zusammenfassung
  • Einleitung
  • Protokoll
  • Ergebnisse
  • Diskussion
  • Materialien
  • Referenzen
  • Nachdrucke und Genehmigungen

Zusammenfassung

Hier stellen wir eine neue und vollautomatische miRNA-Pipeline vor, mirMachine, die 1) bekannte und neuartige miRNAs genauer identifizieren kann und 2) vollautomatisch und frei verfügbar ist. Benutzer können nun ein kurzes Einreichungsskript ausführen, um die vollautomatische mirMachine-Pipeline auszuführen.

Zusammenfassung

Von verschiedenen Arten von nicht-kodierenden RNAs standen microRNAs (miRNAs) in den letzten zehn Jahren wohl im Rampenlicht. Als posttranskriptionelle Regulatoren der Genexpression spielen miRNAs eine Schlüsselrolle in verschiedenen zellulären Signalwegen, einschließlich der Entwicklung und Reaktion auf a/biotischen Stress wie Dürre und Krankheiten. Qualitativ hochwertige Referenzgenomsequenzen ermöglichten die Identifizierung und Annotation von miRNAs in mehreren Pflanzenarten, bei denen miRNA-Sequenzen hochkonserviert sind. Da computergestützte miRNA-Identifikations- und Annotationsprozesse meist fehleranfällige Prozesse sind, erhöhen homologiebasierte Vorhersagen die Vorhersagegenauigkeit. Wir haben in den letzten zehn Jahren die miRNA-Annotationspipeline SUmir entwickelt und verbessert, die seitdem für mehrere Pflanzengenome verwendet wurde.

Diese Studie stellt eine vollautomatische, neue miRNA-Pipeline, mirMachine (miRNA Machine), vor, indem (i) ein zusätzlicher Filterschritt zu den Sekundärstrukturvorhersagen hinzugefügt wird, (ii) sie vollständig automatisiert wird und (iii) neue Optionen eingeführt werden, um entweder bekannte miRNA basierend auf Homologie oder neuartige miRNAs basierend auf kleinen RNA-Sequenzierungslesevorgängen unter Verwendung der vorherigen Pipeline vorherzusagen. Die neue miRNA-Pipeline, mirMachine, wurde mit The Arabidopsis Information Resource, TAIR10, der Veröffentlichung des Arabidopsis-Genoms und dem Weizenreferenzgenom v2 des International Wheat Genome Sequencing Consortium (IWGSC) getestet.

Einleitung

Fortschritte bei Sequenzierungstechnologien der nächsten Generation haben das Verständnis von RNA-Strukturen und regulatorischen Elementen erweitert und funktionell wichtige nicht-kodierende RNAs (ncRNAs) aufgedeckt. Unter den verschiedenen Arten von ncRNAs stellen microRNAs (miRNAs) eine grundlegende regulatorische Klasse kleiner RNAs mit einer Länge zwischen 19 und 24 Nukleotiden in Pflanzendar 1,2. Seit der Entdeckung der ersten miRNA im Fadenwurm Caenorhabditis elegans3 wurden das Vorhandensein und die Funktionen von miRNAs auch in tierischen und pflanzlichen Genomen umfassend untersucht 4,5,6. miRNAs funktionieren, indem sie mRNAs zur Spaltung oder translationalen Repression anvisieren7. Zunehmende Beweise haben auch gezeigt, dass miRNAs an einer Vielzahl biologischer Prozesse in Pflanzen beteiligt sind, einschließlich Wachstum und Entwicklung8, Selbstbiogenese9 und mehrere biotische und abiotische Stressreaktionen10.

In Pflanzen werden miRNAs zunächst aus langen primären Transkripten, sogenannten pri-miRNAs11, verarbeitet. Diese pri-miRNAs, die durch RNA-Polymerase II im Zellkern erzeugt werden, sind lange Transkripte, die eine unvollkommene Foldback-Strukturbilden 12. Die pri-miRNAs durchlaufen später einen Spaltungsprozess, um endogene einzelsträngige (ss) Haarnadelvorläufer von miRNAs, sogenannte prä-miRNAs11, herzustellen. Die prä-miRNA bildet eine Haarnadel-ähnliche Struktur, in der sich ein einzelner Strang zu einer doppelsträngigen Struktur faltet, um einen miRNA-Duplex (miRNA/miRNA*)13 herauszuschneiden. Dicer-ähnliches Protein schneidet beide Stränge des miRNA/miRNA*-Duplex, so dass 2-Nukleotid-3'-Überhänge14,15 übrig bleiben. Der miRNA-Duplex ist innerhalb des Zellkerns methyliert, was das 3'-Ende der miRNA vor Abbau und Uridylierungsaktivitätschützt 16,17. Eine Helikase wickelt den methylierten miRNA-Duplex nach dem Export ab und setzt die reife miRNA dem RNA-induzierten Silencing-Komplex (RISC) im Zytosol18 aus. Ein Strang des Duplex ist reife miRNA, die in RISC eingebaut ist, während der andere Strang, miRNA*, abgebaut wird. Der miRNA-RISC-Komplex bindet an die Zielsequenz, was entweder zum mRNA-Abbau bei vollständiger Komplementarität oder zur translationalen Repression bei partieller Komplementarität führt13.

Basierend auf den Expressions- und Biogenesemerkmalen wurden Richtlinien für die miRNA-Annotation beschrieben15,19. Mit den definierten Richtlinien entwickelten Lucas und Budak die SUmir-Pipeline, um eine homologiebasierte in silico miRNA-Identifizierung in Pflanzendurchzuführen 9. Die SUmir-Pipeline bestand aus zwei Skripten: SUmirFind und SUmirFold. SUmirFind führt Ähnlichkeitssuchen mit bekannten miRNA-Datensätzen durch das Basic Local Alignment Search Tool (BLAST) des National Center for Biotechnology Information (NCBI) mit modifizierten Parametern durch, um Treffer mit nur 2 oder weniger Diskrepanzen einzubeziehen und Verzerrungen in Richtung kürzerer Treffer zu vermeiden (blastn-short -ungapped -penalty -1 -reward 1). SUmirFold wertet die Sekundärstruktur der mutmaßlichen miRNA-Sequenzen aus BLAST20-Ergebnissen mit UNAfold21 aus. SUmirFold unterscheidet miRNAs von kleinen interferierenden RNAs durch die Identifizierung der Eigenschaften der Haarnadelstruktur. Darüber hinaus unterscheidet es miRNAs von anderen ssRNAs wie tRNA und rRNA durch die Parameter, minimalen Faltenenergieindex > 0,67 und GC-Gehalt von 24-71%. Diese Pipeline wurde kürzlich aktualisiert, indem zwei zusätzliche Schritte hinzugefügt wurden, um (i) die Sensitivität zu erhöhen, (ii) die Annotationsgenauigkeit zu erhöhen und (iii) die genomische Verteilung der vorhergesagten miRNA-Genebereitzustellen 22. Angesichts der hohen Erhaltung pflanzlicher miRNA-Sequenzen23 wurde diese Pipeline ursprünglich für die homologiebasierte miRNA-Vorhersage entwickelt. Neuartige miRNAs konnten jedoch mit dieser bioinformatischen Analyse nicht genau identifiziert werden, da sie stark auf der Sequenzkonservierung von miRNAs zwischen eng verwandten Spezies beruhte.

Dieser Artikel stellt eine neue und vollautomatische miRNA-Pipeline vor, mirMachine, die 1) bekannte und neuartige miRNAs genauer identifizieren kann (zum Beispiel verwendet die Pipeline jetzt sRNA-seq-basierte neuartige miRNA-Vorhersagen sowie homologiebasierte miRNA-Identifizierung) und 2) vollständig automatisiert und frei verfügbar ist. Die Ergebnisse umfassten auch die genomischen Verteilungen der vorhergesagten miRNAs. mirMachine wurde sowohl für homologiebasierte als auch für sRNA-seq-basierte Vorhersagen in Weizen- und Arabidopsis-Genomen getestet. Obwohl ursprünglich als freie Software veröffentlicht, wurde UNAfold in den letzten zehn Jahren zu einer kommerziellen Software. Mit diesem Upgrade wurde das Sekundärstrukturvorhersagetool von UNAfold auf RNAfold umgestellt, so dass mirMachine frei verfügbar sein kann. Benutzer können nun ein kurzes Einreichungsskript ausführen, um die vollautomatische mirMachine-Pipeline auszuführen (Beispiele finden Sie unter https://github.com/hbusra/mirMachine.git).

Protokoll

1. Softwareabhängigkeiten und Installation

  1. Installieren Sie Softwareabhängigkeiten von ihrer Home-Site oder mit conda.
    1. Laden Sie Perl herunter und installieren Sie es, falls es nicht bereits installiert ist, von seiner Homepage (https://www.perl.org/get.html).
      HINWEIS: Die dargestellten Ergebnisse wurden mit Perl v5.32.0 vorhergesagt.
    2. Laden Sie Blast+, ein Ausrichtungsprogramm, von seiner Homepage (https://www.ncbi.nlm.nih.gov/books/NBK279671/) als ausführbare Datei und als Quellcode herunter.
      HINWEIS: Die dargestellten Ergebnisse wurden mit BLAST 2.6.0+ vorhergesagt.
    3. Installieren Sie das vorkompilierte Paket von RNAfold von https://www.tbi.univie.ac.at/RNA/.
    4. Alternativ können Sie diese Software mit der folgenden conda installieren: i) conda install -c bioconda blast; ii) Conda Install -C Bioconda ViennaRNA.

2. Das mirMachine Setup und Testen

  1. Laden Sie die neueste Version der mirMachine-Skripte und des mirMachine-Übermittlungsskripts von GitHub, https://github.com/hbusra/mirMachine.git, herunter und legen Sie dann den Skriptpfad in den PATH fest.
  2. Verwenden Sie die auf dem GitHub bereitgestellten Testdaten, um sicherzustellen, dass die mirMachine mit all ihren Abhängigkeiten korrekt heruntergeladen wurde.
  3. Führen Sie die mirMachine mit den unten gezeigten Testdaten aus.
    bash mirMachine_submit.sh -f iwgsc_v2_chr5A.fasta -i mature_high_conf_v22_1.fa.filtered.fasta -n 10
    HINWEIS: Setzen Sie die Option -n auf 10, da die Testdaten nur ein Chromosom des Weizengenoms enthalten. Standardmäßig ist die Option -n auf 20 festgelegt.
  4. Steuern Sie die Ausgabedateien hairpins.tbl.out.tbl für die vorhergesagten reifen miRNAs, ihre vorhergesagten Vorläufer und ihre Positionen auf den Chromosomen.
  5. Überprüfen Sie die Protokolldateien auf die Programmausgaben und Warnungen.

3. Homologiebasierte miRNA-Identifizierung

  1. Führen Sie die mirMachine mit dem unten gezeigten Bash-Skript aus:
    bash mirMachine_submit.sh -f $genome_file -i $input_file -m $mismatches -n $number_of_hits
  2. Überprüfen Sie die vorhergesagten miRNAs. Suchen Sie die Ausgabedatei $input_file.results.tbl.hairpins.tbl.out.tbl für die vorhergesagten miRNAs. Suchen Sie die Ausgabedatei $input_file.results.tbl.hairpins.fsa für die pre-miRNA FASTA-Sequenzen. Suchen Sie die Ausgabedatei $input_file.results.tbl.hairpins.log für die Haarnadel-Protokolldatei.

4. Neuartige miRNA-Identifizierung

  1. Verarbeiten Sie die sRNA-seq FASTQ-Dateien in das richtige FASTA-Format. Trimmadapter bei Bedarf. Schneiden Sie keine Lesevorgänge von geringer Qualität ab. Entfernen Sie sie stattdessen. Lesevorgänge entfernen, die N enthalten. Konvertieren Sie die Datei FASTQ in die Datei FASTA ($input_file).
  2. Führen Sie die mirMachine mit dem unten gezeigten Bash-Skript aus.
    bash mirMachine_submit.sh -f $genome_file -i $input_file -n $number_of_hits -sRNAseq -lmax $lmax -lmin $lmin -rpm $rpm
    HINWEIS: $mismatches wurde für sRNA-seq-basierte Vorhersagen auf 0 gesetzt.
  3. Überprüfen Sie die vorhergesagten miRNAs. Suchen Sie die Ausgabedatei $input_file.results.tbl.hairpins.tbl.out.tbl für die vorhergesagten miRNAs. Suchen Sie die Ausgabedatei $input_file.results.tbl.hairpins.fsa für die pre-miRNA FASTA-Sequenzen. Suchen Sie die Ausgabedatei $input_file.results.tbl.hairpins.log für die Haarnadel-Protokolldatei.

5. Erweiterte Parameter

HINWEIS: Die Standardwerte sind für alle Parameter mit Ausnahme der Genomdatei und der Eingabe-miRNA-Datei definiert.

  1. Legen Sie die Option -db auf eine Blastdatenbank fest, um die Gebäudeverweisdatenbank innerhalb der Pipeline zu überspringen.
  2. Legen Sie die Option -m auf die Anzahl der zulässigen Nichtübereinstimmungen fest.
    HINWEIS: Standardmäßig wurde die Option - m für homologiebasierte Vorhersagen auf 1 und für die sRNA-seq-basierten Vorhersagen auf 0 gesetzt.
  3. Setzen Sie - n auf die Anzahl der Treffer, die nach der Ausrichtung eliminiert werden sollen (Standardwert 20). Ändern Sie dies basierend auf der Art.
  4. Verwenden Sie - long , um die sekundären Strukturen für die verdächtige Liste zu bewerten.
  5. Verwenden Sie das - s , um die neuartige miRNA-Vorhersage basierend auf sRNA-seq-Daten zu aktivieren.
  6. Setzen Sie die Option - lmax auf die maximale Länge der sRNA-seq-Lesevorgänge, die in das Screening einbezogen werden sollen.
  7. Setzen Sie die Option - lmax auf die Mindestlänge der sRNA-seq-Lesevorgänge, die in das Screening einbezogen werden sollen.
  8. Verwenden Sie die Option -rpm , um den Schwellenwert für Lesevorgänge pro Million (RPM) festzulegen.
    HINWEIS: Für fortgeschrittene Parameter wie die Länge von pri-miRNAs/pre-miRNAs werden erfahrene Benutzer ermutigt, die Skripte für ihre Forschung von Interesse zu modifizieren. Wenn die Benutzer beabsichtigen, einige Schritte zu überspringen oder modifizierte Ausgaben zu verwenden, kann das Übermittlungsskript geändert werden, indem einfach # am Anfang der Zeilen hinzugefügt wird, um diese Zeilen zu überspringen.

Ergebnisse

Die oben beschriebene miRNA-Pipeline mirMachine wurde zur schnellen Bewertung der Leistungsfähigkeit der Pipeline auf die Testdaten angewendet. Nur die an miRBase v22.1 deponierten hochzuverlässigen pflanzlichen miRNAs wurden gegen das Chromosom 5A des IWGSC-Weizen-RefSeq-Genoms v224 gescreent. mirMachine_find ergab 312 Treffer für die nicht redundante Liste von 189 hochzuverlässigen miRNAs mit maximal 1 zulässigen Mismatch (Tabelle 1). mirMachine_fold klassifizierten 49 von ...

Diskussion

Unsere miRNA-Pipeline SUmir wurde in den letzten zehn Jahren für die Identifizierung vieler pflanzlicher miRNAs verwendet. Hier haben wir eine neue, vollautomatische und frei verfügbare miRNA-Identifikations- und Annotationspipeline entwickelt, mirMachine. Darüber hinaus war eine Reihe von miRNA-Identifikationspipelines, einschließlich, aber nicht beschränkt auf die vorherige Pipeline, von der UNAfold-Software21 abhängig, die im Laufe der Zeit zu einer kommerziellen Software wurde, obwohl si...

Materialien

NameCompanyCatalog NumberComments
https://www.ncbi.nlm.nih.gov/books/NBK279671/Blast+
https://github.com/hbusra/mirMachine.gitmirMachine submission script
https://www.perl.org/get.htmlPerl
https://www.tbi.univie.ac.at/RNA/RNAfold
Arabidopsis TAIR10
Triticum aestivum (wheat, IWGSC RefSeq v2)

Referenzen

  1. Voinnet, O. Origin, biogenesis, and activity of plant microRNAs. Cell. 136 (4), 669-687 (2009).
  2. Budak, H., Akpinar, B. A. Plant miRNAs: biogenesis, organization and origins. Functional & Integrative Genomics. 15 (5), 523-531 (2015).
  3. Lee, R. C., Feinbaum, R. L., Ambros, V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 75 (5), 843-854 (1993).
  4. Zhang, L., et al. Exogenous plant MIR168a specifically targets mammalian LDLRAP1: evidence of cross-kingdom regulation by microRNA. Cell Research. 22 (1), 107-126 (2012).
  5. Pang, K. C., Frith, M. C., Mattick, J. S. Rapid evolution of noncoding RNAs: Lack of conservation does not mean lack of function. Trends in Genetics. 22 (1), 1-5 (2006).
  6. Guleria, P., Mahajan, M., Bhardwaj, J., Yadav, S. K. Plant small RNAs: biogenesis, mode of action and their roles in abiotic stresses. Genomics, Proteomics and Bioinformatics. 9 (6), 183-199 (2011).
  7. Jones-Rhoades, M. W., Bartel, D. P., Bartel, B. MicroRNAs and their regulatory roles in plants. Annual Review of Plant Biology. 57, 19-53 (2006).
  8. Singh, A., et al. Plant small RNAs: advancement in the understanding of biogenesis and role in plant development. Planta. 248 (3), 545-558 (2018).
  9. Lucas, S. J., Budak, H. Sorting the wheat from the chaff: identifying miRNAs in genomic survey sequences of Triticum aestivum chromosome 1AL. PloS One. 7 (7), 40859 (2012).
  10. Li, S., Castillo-González, C., Yu, B., Zhang, X. The functions of plant small RNAs in development and in stress responses. Plant Journal. 90 (4), 654-670 (2017).
  11. Lee, Y., Jeon, K., Lee, J. T., Kim, S., Kim, V. N. MicroRNA maturation: Stepwise processing and subcellular localization. EMBO Journal. 21 (17), 4663-4670 (2002).
  12. Lee, Y., et al. MicroRNA genes are transcribed by RNA polymerase II. EMBO Journal. 23 (2), 4051-4060 (2004).
  13. Bartel, D. P. MicroRNAs: Genomics, biogenesis, mechanism, and function. Cell. 116 (2), 281-297 (2004).
  14. Lee, Y., et al. The nuclear RNase III Drosha initiates microRNA processing. Nature. 425 (6956), 415-419 (2003).
  15. Meyers, B. C., et al. Criteria for annotation of plant microRNAs. Plant Cell. 20 (12), 3186-3190 (2008).
  16. Sanei, M., Chen, X. Mechanisms of microRNA turnover. Current Opinion in Plant Biology. 27, 199-206 (2015).
  17. Li, J., Yang, Z., Yu, B., Liu, J., Chen, X. Methylation protects miRNAs and siRNAs from a 3′-end uridylation activity in Arabidopsis. Current Biology. 15 (16), 1501-1507 (2005).
  18. Rogers, K., Chen, X. Biogenesis, turnover, and mode of action of plant microRNAs. Plant Cell. 25 (7), 2383-2399 (2013).
  19. Axtell, M. J., Meyers, B. C. Revisiting criteria for plant microRNA annotation in the Era of big data. Plant Cell. 30 (2), 272-284 (2018).
  20. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10 (1), 421 (2009).
  21. Markham, N. R. N., Zuker, M. UNAFold: Software for nucleic acid folding and hybridization. Methods in Molecular Biology. 453, 3-31 (2008).
  22. Alptekin, B., Akpinar, B. A., Budak, H. A comprehensive prescription for plant miRNA identification. Frontiers in Plant Science. 7, 2058 (2017).
  23. Zhang, B., Pan, X., Cannon, C. H., Cobb, G. P., Anderson, T. A. Conservation and divergence of plant microRNA genes. Plant Journal. 46 (2), 243-259 (2006).
  24. Appels, R., et al. Shifting the limits in wheat research and breeding using a fully annotated reference genome. Science. 361 (6403), 7191 (2018).
  25. Wang, Y., Kuang, Z., Li, L., Yang, X. A bioinformatics pipeline to accurately and efficiently analyze the microRNA transcriptomes in plants. Journal of Visualized Experiments: JoVE. (155), e59864 (2020).
  26. Kozomara, A., Griffiths-Jones, S. MiRBase: Annotating high confidence microRNAs using deep sequencing data. Nucleic Acids Research. 42, 68-73 (2014).
  27. Lorenz, R., et al. ViennaRNA Package 2.0. Algorithms for Molecular Biology. 6 (1), 26 (2011).
  28. Wicker, T., et al. Impact of transposable elements on genome structure and evolution in bread wheat. Genome Biology. 19 (1), 103 (2018).
  29. Flavell, R. B., Bennett, M. D., Smith, J. B., Smith, D. B. Genome size and the proportion of repeated nucleotide sequence DNA in plants. Biochemical Genetics. 12 (4), 257-269 (1974).
  30. Wicker, T., et al. The repetitive landscape of the 5100 Mbp barley genome. Mobile DNA. 8, 22 (2017).
  31. Yang, Q., Ye, Q. A., Liu, Y. Mechanism of siRNA production from repetitive DNA. Genes and Development. 29 (5), 526-537 (2015).
  32. Lam, J. K. W., Chow, M. Y. T., Zhang, Y., Leung, S. W. S. siRNA versus miRNA as therapeutics for gene silencing. Molecular Therapy. Nucleic Acids. 4 (9), 252 (2015).
  33. Bartel, B. MicroRNAs directing siRNA biogenesis. Nature Structural and Molecular Biology. 12 (7), 569-571 (2005).
  34. Meng, Y., Shao, C., Wang, H., Chen, M. Are all the miRBase-registered microRNAs true? A structure- and expression-based re-examination in plants. RNA Biology. 9 (3), 249-253 (2012).
  35. Berezikov, E., et al. Evolutionary flux of canonical microRNAs and mirtrons in Drosophila. Nature Genetics. 42 (1), 6-9 (2010).

Nachdrucke und Genehmigungen

Genehmigung beantragen, um den Text oder die Abbildungen dieses JoVE-Artikels zu verwenden

Genehmigung beantragen

Weitere Artikel entdecken

BiologieAusgabe 171

This article has been published

Video Coming Soon

JoVE Logo

Datenschutz

Nutzungsbedingungen

Richtlinien

Forschung

Lehre

ÜBER JoVE

Copyright © 2025 MyJoVE Corporation. Alle Rechte vorbehalten