JoVE Logo

Sign In

A subscription to JoVE is required to view this content. Sign in or start your free trial.

In This Article

  • Summary
  • Abstract
  • Introduction
  • Protocol
  • תוצאות
  • Discussion
  • Materials
  • References
  • Reprints and Permissions

Summary

כאן אנו מציגים צינור miRNA חדש ואוטומטי לחלוטין, mirMachine ש-1) יכול לזהות miRNAs ידועים וחדשניים בצורה מדויקת יותר ו-2) הוא אוטומטי לחלוטין וזמין באופן חופשי. משתמשים יכולים כעת לבצע סקריפט הגשה קצר כדי להפעיל את צינור mirMachine האוטומטי לחלוטין.

Abstract

מבין סוגים שונים של רנ"א שאינם מקודדים, מיקרו-רנ"א (miRNAs) היו ללא ספק באור הזרקורים בעשור האחרון. כמווסתים לאחר שעתוק של ביטוי גנים, miRNAs ממלאים תפקידי מפתח במסלולים תאיים שונים, כולל התפתחות ותגובה ללחץ a/ביוטי, כגון בצורת ומחלות. רצפי גנום ייחוס איכותיים אפשרו זיהוי וביאור של miRNAs במספר מיני צמחים, שבהם רצפי miRNA נשמרים מאוד. מכיוון שתהליכי זיהוי וביאור miRNA חישוביים הם בעיקר תהליכים מועדים לשגיאות, תחזיות מבוססות הומולוגיה מגבירות את דיוק החיזוי. פיתחנו ושיפרנו את צינור ביאור miRNA, SUmir, בעשור האחרון, המשמש למספר גנומים של צמחים מאז.

מחקר זה מציג צינור miRNA חדש ואוטומטי לחלוטין, mirMachine (miRNA Machine), על ידי (i) הוספת שלב סינון נוסף על תחזיות המבנה המשני, (ii) הפיכתו לאוטומטי לחלוטין, ו-(iii) הצגת אפשרויות חדשות לחיזוי miRNA ידוע המבוסס על הומולוגיה או miRNAs חדשים המבוססים על קריאות ריצוף RNA קטנות באמצעות הצינור הקודם. צינור miRNA החדש, mirMachine, נבדק באמצעות משאב המידע Arabidopsis, TAIR10, שחרור הגנום של Arabidopsis וקונסורציום ריצוף החיטה הבינלאומי (IWGSC) גנום ייחוס חיטה v2.

Introduction

ההתקדמות בטכנולוגיות ריצוף הדור הבא הרחיבה את ההבנה של מבני RNA ואלמנטים רגולטוריים, וחשפה רנ"א חשובים מבחינה פונקציונלית שאינם מקודדים (ncRNAs). מבין סוגים שונים של ncRNAs, מיקרו-רנ"א (miRNAs) מהווים סוג ויסות בסיסי של רנ"א קטנים באורך שבין 19 ל-24 נוקלאוטידים בצמחים 1,2. מאז גילוי ה-miRNA הראשון בנמטודה Caenorhabditis elegans3, נוכחותם ותפקודם של miRNAs נחקרו בהרחבה גם בגנומים של בעלי חיים וצמחים, כמו גםב-4,5,6. miRNAs פועלים על ידי מיקוד mRNA עבור ביקוע או דיכוי תרגום7. עדויות מצטברות הראו גם כי miRNAs מעורבים במגוון רחב של תהליכים ביולוגיים בצמחים, כולל גדילה והתפתחות8, ביוגנזה עצמית9, ומספר תגובות עקה ביוטיות וא-ביוטיות10.

בצמחים, miRNAs מעובדים בתחילה מתעתיקים ראשוניים ארוכים הנקראים pri-miRNAs11. פרי-miRNAs אלה הנוצרים על ידי RNA פולימראז II בתוך הגרעין הם תעתיקים ארוכים היוצרים מבנה אחורי מתקפל לא מושלם12. הפרי-miRNAs עוברים מאוחר יותר תהליך ביקוע כדי לייצר מבשרי סיכות ראש חד-גדיליות אנדוגניות (ss) של miRNAs הנקראים pre-miRNAs11. הקדם-miRNA יוצר מבנה דמוי סיכת שיער שבו גדיל יחיד מתקפל למבנה דו-גדילי כדי לכרות דופלקס miRNA (miRNA/miRNA*)13. חלבון דמוי דיקר חותך את שני הגדילים של הדופלקס miRNA/miRNA*, ומשאיר 2-נוקלאוטיד 3'-overhangs14,15. דופלקס miRNA הוא מתילציה בתוך הגרעין, אשר מגן על 3'-קצה של miRNA מפני השפלה ופעילות uridylation16,17. הליקאז משחרר את דופלקס ה-miRNA שעבר מתילציה לאחר הייצוא וחושף את ה-miRNA הבוגר לקומפלקס ההשתקה המושרה על-ידי רנ"א (RISC) בציטוזול18. גדיל אחד של הדופלקס הוא miRNA בוגר המשולב ב-RISC , ואילו הגדיל השני, miRNA*, מתפרק. קומפלקס miRNA-RISC נקשר לרצף המטרה המוביל להתפרקות mRNA במקרה של השלמה מלאה או דיכוי תרגומי במקרה של השלמה חלקית13.

בהתבסס על תכונות הביטוי והביוגנזה, תוארו קווים מנחים לביאור miRNA15,19. עם ההנחיות שהוגדרו, לוקאס ובודאק פיתחו את צינור SUmir לביצוע הומולוגיה מבוססת זיהוי miRNA סיליקו בצמחים9. צינור SUmir הורכב משני תסריטים: SUmirFind ו- SUmirFold. SUmirFind מבצעת חיפושי דמיון מול מערכי נתונים ידועים של miRNA באמצעות המרכז הלאומי למידע ביוטכנולוגי (NCBI) סריקת כלי חיפוש יישור מקומי בסיסי (BLAST) עם פרמטרים ששונו כדי לכלול להיטים עם רק 2 או פחות אי התאמות וכדי למנוע הטיה לכיוון פגיעות קצרות יותר (blastn-short -unapped -עונש -1 -פרס 1). SUmirFold מעריך את המבנה המשני של רצפי miRNA פוטטיביים מתוצאות BLAST20 באמצעות UNAfold21. SUmirFold מבדיל בין miRNAs לבין רנ"א מפריעים קטנים על ידי זיהוי המאפיינים של מבנה סיכות הראש. יתר על כן, הוא מבדיל miRNAs מ ssRNAs אחרים כגון tRNA ו rRNA על ידי הפרמטרים, מדד אנרגיה קיפול מינימלי > 0.67 ותכולת GC של 24-71%. צינור זה עודכן לאחרונה על ידי הוספת שני שלבים נוספים כדי (i) להגביר את הרגישות, (ii) להגדיל את דיוק הביאור, ו-(iii) לספק הפצה גנומית של הגנים miRNA חזוי22. בהתחשב בשימור הגבוה של רצפי miRNA צמחיים23, צינור זה תוכנן במקור לחיזוי miRNA מבוסס הומולוגיה. עם זאת, לא ניתן היה לזהות במדויק את ה-miRNAs החדשים עם ניתוח ביואינפורמטיקה זה, שכן הוא הסתמך במידה רבה על שימור רצפים של miRNAs בין מינים קרובים.

מאמר זה מציג צינור miRNA חדש ואוטומטי לחלוטין, mirMachine כי 1) יכול לזהות miRNAs ידועים וחדשים בצורה מדויקת יותר (לדוגמה, הצינור משתמש כעת בתחזיות miRNA חדשניות מבוססות sRNA-seq כמו גם זיהוי miRNA מבוסס הומולוגיה) ו-2) הוא אוטומטי לחלוטין וזמין באופן חופשי. התפוקות כללו גם את ההתפלגויות הגנומיות של ה-miRNAs החזויים. mirMachine נבדקה הן לתחזיות מבוססות הומולוגיה והן לתחזיות מבוססות sRNA-seq בגנומים של חיטה וערבידופסיס . למרות ששוחררה בתחילה כתוכנה חופשית, UNAfold הפכה לתוכנה מסחרית בעשור האחרון. עם שדרוג זה, כלי חיזוי המבנה המשני הועבר מ- UNAfold ל- RNAfold כך ש- mirMachine יכול להיות זמין באופן חופשי. משתמשים יכולים כעת לבצע סקריפט הגשה קצר כדי להפעיל את צינור mirMachine האוטומטי לחלוטין (דוגמאות מסופקות ב- https://github.com/hbusra/mirMachine.git).

Protocol

1. תלות בתוכנה והתקנה

  1. התקן יחסי תלות של תוכנה מאתר הבית שלהם או באמצעות conda.
    1. הורד והתקן את Perl, אם הוא עדיין לא מותקן, מאתר הבית שלו (https://www.perl.org/get.html).
      הערה: התוצאות המיוצגות נחזו באמצעות Perl v5.32.0.
    2. הורד את Blast+, תוכנית יישור, מאתר הבית שלה (https://www.ncbi.nlm.nih.gov/books/NBK279671/) כקובץ הפעלה וכקוד מקור.
      הערה: התוצאות המיוצגות נחזו באמצעות BLAST 2.6.0+.
    3. התקן חבילה מוכנה מראש של RNAfold מ- https://www.tbi.univie.ac.at/RNA/.
    4. לחלופין, התקן תוכנות אלה באמצעות הקונדה הבאה: i) conda להתקין -c bioconda blast; II) קונדה להתקין -C ביוקונדה וינרנה.

2. ההתקנה והבדיקה של mirMachine

  1. הורד את הגרסה העדכנית ביותר של סקריפטים mirMachine ואת סקריפט השליחה mirMachine מ- GitHub, https://github.com/hbusra/mirMachine.git, ולאחר מכן הגדר את נתיב הסקריפטים ל- PATH.
  2. השתמש בנתוני הבדיקה המסופקים ב- GitHub כדי לוודא שה- mirMachine יחד עם כל יחסי התלות שלו הורדו כראוי.
  3. הפעל את mirMachine על נתוני הבדיקה המוצגים להלן.
    bash mirMachine_submit.sh -f iwgsc_v2_chr5A.fasta -i mature_high_conf_v22_1.fa.filtered.fasta -n 10
    הערה: הגדר את האפשרות - n ל- 10 מכיוון שנתוני הבדיקה מכילים רק כרומוזום אחד של גנום החיטה. בברירות מחדל, האפשרות -n מוגדרת ל - 20.
  4. שלוט בקבצי הפלט של סיכות השיער.tbl.out.tbl עבור ה-miRNAs הבוגרים החזויים, המבשרים החזויים שלהם ומיקומם על הכרומוזומים.
  5. בדוק את קבצי יומן הרישום עבור יציאות התוכנית ואזהרות.

3. זיהוי miRNA מבוסס הומולוגיה

  1. הפעל את mirMachine באמצעות סקריפט bash המוצג להלן:
    bash mirMachine_submit.sh -f $genome_file -i $input_file -m $mismatches -n $number_of_hits
  2. בדוק את miRNAs חזוי. מצא את קובץ הפלט בשם $input_file.results.tbl.hairpins.tbl.out.tbl עבור miRNAs החזויים. מצא את קובץ הפלט בשם $input_file.results.tbl.hairpins.fsa עבור רצפי FASTA שלפני miRNA. מצא את קובץ הפלט בשם $input_file.results.tbl.hairpins.log עבור קובץ יומן סיכות השיער.

4. זיהוי miRNA חדשני

  1. עיבוד מקדים של קבצי sRNA-seq FASTQ לפורמט FASTA מתאים. חתוך מתאמים במידת הצורך. אל תחתוך קריאות באיכות נמוכה; במקום זאת, הסר אותם. הסר קריאות המכילות N. המר את קובץ FASTQ לקובץ FASTA ($input_file).
  2. הפעל את mirMachine באמצעות סקריפט bash המוצג להלן.
    bash mirMachine_submit.sh -f $genome_file -i $input_file -n $number_of_hits -sRNAseq -lmax $lmax -lmin $lmin -rpm $rpm
    הערה: $mismatches הוגדר ל-0 עבור תחזיות מבוססות sRNA-seq.
  3. בדוק את miRNAs חזוי. מצא את קובץ הפלט בשם $input_file.results.tbl.hairpins.tbl.out.tbl עבור miRNAs החזויים. מצא את קובץ הפלט בשם $input_file.results.tbl.hairpins.fsa עבור רצפי FASTA pre-miRNA. מצא את קובץ הפלט בשם $input_file.results.tbl.hairpins.log עבור קובץ יומן סיכות השיער.

5. פרמטרים מתקדמים

הערה: ברירות המחדל מוגדרות עבור כל הפרמטרים למעט קובץ הגנום וקובץ miRNA הקלט.

  1. הגדר את האפשרות -db למסד נתונים של פיצוץ כדי לדלג על מסד הנתונים של הפניה לבניין בתוך הצינור.
  2. הגדר את האפשרות - m למספר אי-ההתאמות המותרות.
    הערה: בברירת המחדל, האפשרות -m הוגדרה ל- 1 עבור תחזיות מבוססות הומולוגיה ו- 0 עבור תחזיות מבוססות sRNA-seq.
  3. הגדר את ה- -n למספר הפגיעות שיש לבטל לאחר יישור (ברירת המחדל היא 20). שנה זאת בהתבסס על המינים.
  4. השתמש ב- -long כדי להעריך את המבנים המשניים עבור רשימת החשודים.
  5. השתמש ב-s כדי להפעיל את חיזוי miRNA החדש בהתבסס על נתוני sRNA-seq .
  6. הגדר את האפשרות -lmax לאורך המרבי של קריאות sRNA-seq שייכללו בהקרנה.
  7. הגדר את האפשרות -lmax לאורך המינימלי של קריאות sRNA-seq שייכללו בהקרנה.
  8. השתמש באפשרות -סל"ד כדי להגדיר את סף הקריאות למיליון ( סל" ד).
    הערה: עבור פרמטרים מתקדמים כמו אורך ה-pri-miRNAs/pre-miRNAs, משתמשים מנוסים מוזמנים לשנות את הסקריפטים לצורך מחקר העניין שלהם. בנוסף, אם המשתמשים מתכוונים לדלג על שלבים מסוימים או מעדיפים להשתמש בפלטים שהשתנו, ניתן לשנות את סקריפט השליחה פשוט על ידי הוספת # בתחילת השורות כדי לדלג על שורות אלה.

תוצאות

צינור miRNA, mirMachine, שתואר לעיל הוחל על נתוני הבדיקה להערכה מהירה של ביצועי הצינור. רק ה-miRNAs הצמחיים בעלי הביטחון הגבוה שהופקדו ב-miRBase v22.1 נבדקו מול כרומוזום 5A של הגנום RefSeq של חיטה IWGSC v224. mirMachine_find החזיר 312 כניסות לרשימה הלא-מיותרת של 189 miRNAs בעלי ביטחון גבוה עם מקסימום של אי-התאמה אחת מ...

Discussion

צינור ה-miRNA שלנו, SUmir, שימש לזיהוי של miRNAs צמחיים רבים בעשור האחרון. כאן, פיתחנו צינור זיהוי וביאור miRNA חדש, אוטומטי לחלוטין וזמין באופן חופשי, mirMachine. יתר על כן, מספר צינורות זיהוי miRNA כולל, אך לא מוגבל לצינור הקודם, היו תלויים בתוכנת UNAfold21, שהפכה עם הזמן לתוכנה מסחרית, אם כי בעבר היית...

Materials

NameCompanyCatalog NumberComments
https://www.ncbi.nlm.nih.gov/books/NBK279671/Blast+
https://github.com/hbusra/mirMachine.gitmirMachine submission script
https://www.perl.org/get.htmlPerl
https://www.tbi.univie.ac.at/RNA/RNAfold
Arabidopsis TAIR10
Triticum aestivum (wheat, IWGSC RefSeq v2)

References

  1. Voinnet, O. Origin, biogenesis, and activity of plant microRNAs. Cell. 136 (4), 669-687 (2009).
  2. Budak, H., Akpinar, B. A. Plant miRNAs: biogenesis, organization and origins. Functional & Integrative Genomics. 15 (5), 523-531 (2015).
  3. Lee, R. C., Feinbaum, R. L., Ambros, V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 75 (5), 843-854 (1993).
  4. Zhang, L., et al. Exogenous plant MIR168a specifically targets mammalian LDLRAP1: evidence of cross-kingdom regulation by microRNA. Cell Research. 22 (1), 107-126 (2012).
  5. Pang, K. C., Frith, M. C., Mattick, J. S. Rapid evolution of noncoding RNAs: Lack of conservation does not mean lack of function. Trends in Genetics. 22 (1), 1-5 (2006).
  6. Guleria, P., Mahajan, M., Bhardwaj, J., Yadav, S. K. Plant small RNAs: biogenesis, mode of action and their roles in abiotic stresses. Genomics, Proteomics and Bioinformatics. 9 (6), 183-199 (2011).
  7. Jones-Rhoades, M. W., Bartel, D. P., Bartel, B. MicroRNAs and their regulatory roles in plants. Annual Review of Plant Biology. 57, 19-53 (2006).
  8. Singh, A., et al. Plant small RNAs: advancement in the understanding of biogenesis and role in plant development. Planta. 248 (3), 545-558 (2018).
  9. Lucas, S. J., Budak, H. Sorting the wheat from the chaff: identifying miRNAs in genomic survey sequences of Triticum aestivum chromosome 1AL. PloS One. 7 (7), 40859 (2012).
  10. Li, S., Castillo-González, C., Yu, B., Zhang, X. The functions of plant small RNAs in development and in stress responses. Plant Journal. 90 (4), 654-670 (2017).
  11. Lee, Y., Jeon, K., Lee, J. T., Kim, S., Kim, V. N. MicroRNA maturation: Stepwise processing and subcellular localization. EMBO Journal. 21 (17), 4663-4670 (2002).
  12. Lee, Y., et al. MicroRNA genes are transcribed by RNA polymerase II. EMBO Journal. 23 (2), 4051-4060 (2004).
  13. Bartel, D. P. MicroRNAs: Genomics, biogenesis, mechanism, and function. Cell. 116 (2), 281-297 (2004).
  14. Lee, Y., et al. The nuclear RNase III Drosha initiates microRNA processing. Nature. 425 (6956), 415-419 (2003).
  15. Meyers, B. C., et al. Criteria for annotation of plant microRNAs. Plant Cell. 20 (12), 3186-3190 (2008).
  16. Sanei, M., Chen, X. Mechanisms of microRNA turnover. Current Opinion in Plant Biology. 27, 199-206 (2015).
  17. Li, J., Yang, Z., Yu, B., Liu, J., Chen, X. Methylation protects miRNAs and siRNAs from a 3′-end uridylation activity in Arabidopsis. Current Biology. 15 (16), 1501-1507 (2005).
  18. Rogers, K., Chen, X. Biogenesis, turnover, and mode of action of plant microRNAs. Plant Cell. 25 (7), 2383-2399 (2013).
  19. Axtell, M. J., Meyers, B. C. Revisiting criteria for plant microRNA annotation in the Era of big data. Plant Cell. 30 (2), 272-284 (2018).
  20. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10 (1), 421 (2009).
  21. Markham, N. R. N., Zuker, M. UNAFold: Software for nucleic acid folding and hybridization. Methods in Molecular Biology. 453, 3-31 (2008).
  22. Alptekin, B., Akpinar, B. A., Budak, H. A comprehensive prescription for plant miRNA identification. Frontiers in Plant Science. 7, 2058 (2017).
  23. Zhang, B., Pan, X., Cannon, C. H., Cobb, G. P., Anderson, T. A. Conservation and divergence of plant microRNA genes. Plant Journal. 46 (2), 243-259 (2006).
  24. Appels, R., et al. Shifting the limits in wheat research and breeding using a fully annotated reference genome. Science. 361 (6403), 7191 (2018).
  25. Wang, Y., Kuang, Z., Li, L., Yang, X. A bioinformatics pipeline to accurately and efficiently analyze the microRNA transcriptomes in plants. Journal of Visualized Experiments: JoVE. (155), e59864 (2020).
  26. Kozomara, A., Griffiths-Jones, S. MiRBase: Annotating high confidence microRNAs using deep sequencing data. Nucleic Acids Research. 42, 68-73 (2014).
  27. Lorenz, R., et al. ViennaRNA Package 2.0. Algorithms for Molecular Biology. 6 (1), 26 (2011).
  28. Wicker, T., et al. Impact of transposable elements on genome structure and evolution in bread wheat. Genome Biology. 19 (1), 103 (2018).
  29. Flavell, R. B., Bennett, M. D., Smith, J. B., Smith, D. B. Genome size and the proportion of repeated nucleotide sequence DNA in plants. Biochemical Genetics. 12 (4), 257-269 (1974).
  30. Wicker, T., et al. The repetitive landscape of the 5100 Mbp barley genome. Mobile DNA. 8, 22 (2017).
  31. Yang, Q., Ye, Q. A., Liu, Y. Mechanism of siRNA production from repetitive DNA. Genes and Development. 29 (5), 526-537 (2015).
  32. Lam, J. K. W., Chow, M. Y. T., Zhang, Y., Leung, S. W. S. siRNA versus miRNA as therapeutics for gene silencing. Molecular Therapy. Nucleic Acids. 4 (9), 252 (2015).
  33. Bartel, B. MicroRNAs directing siRNA biogenesis. Nature Structural and Molecular Biology. 12 (7), 569-571 (2005).
  34. Meng, Y., Shao, C., Wang, H., Chen, M. Are all the miRBase-registered microRNAs true? A structure- and expression-based re-examination in plants. RNA Biology. 9 (3), 249-253 (2012).
  35. Berezikov, E., et al. Evolutionary flux of canonical microRNAs and mirtrons in Drosophila. Nature Genetics. 42 (1), 6-9 (2010).

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Explore More Articles

171

This article has been published

Video Coming Soon

JoVE Logo

Privacy

Terms of Use

Policies

Research

Education

ABOUT JoVE

Copyright © 2025 MyJoVE Corporation. All rights reserved