Войдите в систему

Для просмотра этого контента требуется подписка на Jove Войдите в систему или начните бесплатную пробную версию.

В этой статье

  • Резюме
  • Аннотация
  • Введение
  • протокол
  • Результаты
  • Обсуждение
  • Материалы
  • Ссылки
  • Перепечатки и разрешения

Резюме

Здесь мы представляем новый и полностью автоматизированный конвейер miRNA, mirMachine, который 1) может более точно идентифицировать известные и новые miRNAs и 2) полностью автоматизирован и находится в свободном доступе. Теперь пользователи могут выполнять короткий сценарий отправки для запуска полностью автоматизированного конвейера mirMachine.

Аннотация

Из различных типов некодирующих РНК микроРНК (миРНК), возможно, были в центре внимания в течение последнего десятилетия. Как посттранскрипционные регуляторы экспрессии генов, миРНК играют ключевую роль в различных клеточных путях, включая как развитие, так и реакцию на а/биотический стресс, такой как засуха и болезни. Наличие высококачественных эталонных последовательностей генома позволило идентифицировать и аннотировать миРНК у нескольких видов растений, где последовательности миРНК сильно сохраняются. Поскольку вычислительная идентификация миРНК и процессы аннотации в основном подвержены ошибкам, прогнозы на основе гомологии повышают точность прогнозирования. За последнее десятилетие мы разработали и улучшили конвейер аннотаций miRNA, SUmir, который с тех пор использовался для нескольких геномов растений.

В этом исследовании представлен полностью автоматизированный новый конвейер миРНК, mirMachine (miRNA Machine), путем (i) добавления дополнительного этапа фильтрации для предсказаний вторичной структуры, (ii) обеспечения его полной автоматизации и (iii) введения новых вариантов прогнозирования либо известной миРНК на основе гомологии, либо новых миРНК на основе чтения секвенирования малых РНК с использованием предыдущего конвейера. Новый трубопровод miRNA, mirMachine, был протестирован с использованием информационного ресурса Arabidopsis, TAIR10, выпуска генома Arabidopsis и Эталонного генома пшеницы Международного консорциума по секвенированию генома пшеницы (IWGSC) v2.

Введение

Достижения в технологиях секвенирования следующего поколения расширили понимание структур РНК и регуляторных элементов, выявив функционально важные некодирующие РНК (ncRNAs). Среди различных типов нРНК микроРНК (миРНК) составляют фундаментальный регуляторный класс малых РНК длиной от 19 до 24 нуклеотидов в растениях 1,2. С момента открытия первой миРНК у нематоды Caenorhabditis elegans3 наличие и функции миРНК были широко изучены в геномах животных и растений, а также 4,5,6. миРНК функционируют, нацеливаясь на мРНК для расщепления или трансляционного подавления7. Накопленные данные также показали, что миРНК участвуют в широком спектре биологических процессов у растений, включая рост и развитие8, самобиогенез9 и несколько биотических и абиотических стрессовых реакций10.

В растениях миРНК первоначально обрабатываются из длинных первичных транскриптов, называемых примиРНК11. Эти примиРНК, генерируемые РНК-полимеразой II внутри ядра, представляют собой длинные транскрипты, образующие несовершенную складчатую структуру12. При-миРНК позже подвергаются процессу расщепления с целью получения эндогенных одноцепочечных (ss) шпильк-предшественников миРНК, называемых премиРНК11. ПремиРНК образует шпилькообразную структуру, в которой одна прядь складывается в двухцепочечную структуру для иссечения дуплекса миРНК (миРНК/миРНК*)13. Дицероподобный белок разрезает обе нити дуплекса миРНК/миРНК*, оставляя 2-нуклеотидные 3'-навесы14,15. Дуплекс миРНК метилируется внутри ядра, что защищает 3'-конец миРНК от деградации и активности уридилирования16,17. Геликаза раскручивает дуплекс метилированной миРНК после экспорта и подвергает зрелую миРНК воздействию РНК-индуцированного комплекса глушения (RISC) в цитозоле18. Одна нить дуплекса представляет собой зрелую миРНК, включенную в RISC, тогда как другая цепь, miRNA*, деградирует. Комплекс miRNA-RISC связывается с целевой последовательностью, что приводит либо к деградации мРНК в случае полной комплементарности, либо к трансляционному подавлению в случае частичной комплементарности13.

Основываясь на особенностях экспрессии и биогенеза, были описаны рекомендации по аннотации миРНК15,19. С определенными руководящими принципами Лукас и Будак разработали конвейер SUmir для выполнения идентификации гомологии in silico miRNA в растениях9. Конвейер SUmir состоял из двух сценариев: SUmirFind и SUmirFold. SUmirFind выполняет поиск по сходству с известными наборами данных miRNA с помощью базового инструмента поиска локального выравнивания (BLAST) Национального центра биотехнологической информации (NCBI) с измененными параметрами, чтобы включить попадания только с 2 или менее несоответствиями и избежать смещения в сторону более коротких попаданий (blastn-short -ungapped -penalty -1 -reward 1). SUmirFold оценивает вторичную структуру предполагаемых последовательностей миРНК из результатов BLAST20 с использованием UNAfold21. SUmirFold дифференцирует микроРНК от малых интерферирующих РНК путем идентификации характеристик структуры шпильки. Более того, он дифференцирует миРНК от других ssRNAs, таких как тРНК и рРНК, по параметрам, минимальному энергетическому индексу складки > 0,67 и содержанию ГК 24-71%. Этот конвейер был недавно обновлен путем добавления двух дополнительных шагов для (i) повышения чувствительности, (ii) повышения точности аннотаций и (iii) обеспечения геномного распределения прогнозируемых генов miRNA22. Учитывая высокую сохранность последовательностей миРНК растений23, этот конвейер был первоначально разработан для прогнозирования миРНК на основе гомологии. Новые микроРНК, однако, не могут быть точно идентифицированы с помощью этого биоинформатического анализа, поскольку он в значительной степени зависит от сохранения последовательности микроРНК между близкородственными видами.

В этой статье представлен новый и полностью автоматизированный конвейер миРНК, mirMachine, который 1) может более точно идентифицировать известные и новые миРНК (например, конвейер теперь использует новые прогнозы миРНК на основе sRNA-seq, а также идентификацию miRNA на основе гомологии) и 2) полностью автоматизирован и находится в свободном доступе. Результаты также включали геномные распределения прогнозируемых миРНК. mirMachine был протестирован как на основе гомологии, так и на основе sRNA-seq предсказаний в геномах пшеницы и арабидопсиса . Хотя первоначально UNAfold был выпущен как свободное программное обеспечение, в последнее десятилетие он стал коммерческим программным обеспечением. С этим обновлением инструмент прогнозирования вторичной структуры был переключен с UNAfold на RNAfold, так что mirMachine может быть в свободном доступе. Теперь пользователи могут выполнять короткий сценарий отправки для запуска полностью автоматизированного конвейера mirMachine (примеры приведены в https://github.com/hbusra/mirMachine.git).

протокол

1. Программные зависимости и установка

  1. Установите программные зависимости со своего домашнего сайта или с помощью conda.
    1. Загрузите и установите Perl, если он еще не установлен, с его домашнего сайта (https://www.perl.org/get.html).
      ПРИМЕЧАНИЕ: Представленные результаты были предсказаны с использованием Perl v5.32.0.
    2. Загрузите Blast+, программу выравнивания, со своего домашнего сайта (https://www.ncbi.nlm.nih.gov/books/NBK279671/) в качестве исполняемого файла и исходного кода.
      ПРИМЕЧАНИЕ: Представленные результаты были предсказаны с использованием BLAST 2.6.0+.
    3. Установите предварительно скомпилированный пакет RNAfold из https://www.tbi.univie.ac.at/RNA/.
    4. В качестве альтернативы, установите эти программы, используя следующую conda: i) conda install -c bioconda blast; ii) conda install -c биоконда viennarna.

2. Настройка и тестирование mirMachine

  1. Загрузите последнюю версию скриптов mirMachine и сценария отправки mirMachine с GitHub, https://github.com/hbusra/mirMachine.git, а затем задайте путь к скриптам в PATH.
  2. Используйте тестовые данные, предоставленные на GitHub, чтобы убедиться, что mirMachine вместе со всеми его зависимостями были загружены правильно.
  3. Запустите mirMachine на тестовых данных, показанных ниже.
    bash mirMachine_submit.sh -f iwgsc_v2_chr5A.fasta -i mature_high_conf_v22_1.fa.filtered.fasta -n 10
    ПРИМЕЧАНИЕ: Установите для параметра -n значение 10, так как данные теста содержат только одну хромосому генома пшеницы. По умолчанию параметр -n имеет значение 20.
  4. Контролируйте выходные файлы hairpins.tbl.out.tbl для прогнозируемых зрелых микроРНК, их прогнозируемых предшественников и их расположения на хромосомах.
  5. Проверьте файлы журнала на наличие выходных данных и предупреждений программы.

3. Идентификация миРНК на основе гомологии

  1. Запустите mirMachine с помощью bash-скрипта, показанного ниже:
    bash mirMachine_submit.sh -f $genome_файл -i $input_файл -m $mismatches -n $number_хитов
  2. Проверьте прогнозируемые микроРНК. Найдите выходной файл с именем $input_file.results.tbl.hairpins.tbl.out.tbl для прогнозируемых микроРНК. Найдите выходной файл с именем $input_file.results.tbl.hairpins.fsa для последовательностей ПРЕМИРНК FASTA. Найдите выходной файл с именем $input_file.results.tbl.hairpins.log для файла журнала шпилек.

4. Новая идентификация миРНК

  1. Препроцессируйте файлы sRNA-seq FASTQ в соответствующий формат FASTA. При необходимости обрежьте адаптеры. Не обрезайте некачественные показания; вместо этого удалите их. Удалите чтение, содержащее N. Конвертируйте файл FASTQ в файл FASTA ($input_файл).
  2. Запустите mirMachine с помощью bash-скрипта, показанного ниже.
    bash mirMachine_submit.sh -f $genome_file -i $input_file -n $number_of_hits -sRNAseq -lmax $lmax -lmin $lmin -rpm $rpm
    ПРИМЕЧАНИЕ: $mismatches было установлено значение 0 для прогнозов на основе sRNA-seq.
  3. Проверьте прогнозируемые микроРНК. Найдите выходной файл с именем $input_file.results.tbl.hairpins.tbl.out.tbl для прогнозируемых miRNAs. Найдите выходной файл с именем $input_file.results.tbl.hairpins.fsa для последовательностей FASTA пре-miRNA. Найдите выходной файл с именем $input_file.results.tbl.hairpins.log для файла журнала шпилек.

5. Предварительные параметры

ПРИМЕЧАНИЕ: Значения по умолчанию определены для всех параметров, за исключением файла генома и входного файла miRNA.

  1. Установите для параметра -db значение базы данных blast, чтобы пропустить базу данных ссылок на построение в конвейере.
  2. Установите для параметра -m допустимое количество несоответствий.
    ПРИМЕЧАНИЕ: По умолчанию параметр -m был установлен равным 1 для предсказаний на основе гомологий и 0 для предсказаний на основе sRNA-seq.
  3. Установите для параметра -n количество обращений, которое необходимо устранить после выравнивания (по умолчанию равно 20). Измените это в зависимости от вида.
  4. Используйте -long для оценки вторичных структур для списка подозреваемых.
  5. Используйте -s для активации нового предсказания miRNA на основе данных sRNA-seq.
  6. Установите параметр -lmax на максимальную длину считывания sRNA-seq для включения в скрининг.
  7. Установите параметр -lmax на минимальную длину считывания sRNA-seq для включения в скрининг.
  8. Параметр -rpm используется для установки порогового значения чтения на миллион (RPM).
    ПРИМЕЧАНИЕ: Для расширенных параметров, таких как длина pri-miRNAs /pre-miRNAs, опытным пользователям рекомендуется изменять скрипты для интересующих их исследований. Кроме того, если пользователи намерены пропустить некоторые шаги или предпочитают использовать измененные выходные данные, сценарий отправки можно изменить, просто добавив # в начале строк, чтобы пропустить эти строки.

Результаты

Трубопровод miRNA, mirMachine, описанный выше, был применен к тестовым данным для быстрой оценки производительности конвейера. Только высоконадежные растительные миРНК, депонированные в miRBase v22.1, были проверены на хромосому 5A генома IWGSC пшеницы RefSeq v224. mirMachine_find вернул 312 попаданий в...

Обсуждение

Наш конвейер миРНК, SUmir, использовался для идентификации многих растительных миРНК в течение последнего десятилетия. Здесь мы разработали новый, полностью автоматизированный и свободно доступный конвейер идентификации и аннотации miRNA, mirMachine. Кроме того, ряд конвейеров идентификации miR...

Материалы

NameCompanyCatalog NumberComments
https://www.ncbi.nlm.nih.gov/books/NBK279671/Blast+
https://github.com/hbusra/mirMachine.gitmirMachine submission script
https://www.perl.org/get.htmlPerl
https://www.tbi.univie.ac.at/RNA/RNAfold
Arabidopsis TAIR10
Triticum aestivum (wheat, IWGSC RefSeq v2)

Ссылки

  1. Voinnet, O. Origin, biogenesis, and activity of plant microRNAs. Cell. 136 (4), 669-687 (2009).
  2. Budak, H., Akpinar, B. A. Plant miRNAs: biogenesis, organization and origins. Functional & Integrative Genomics. 15 (5), 523-531 (2015).
  3. Lee, R. C., Feinbaum, R. L., Ambros, V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 75 (5), 843-854 (1993).
  4. Zhang, L., et al. Exogenous plant MIR168a specifically targets mammalian LDLRAP1: evidence of cross-kingdom regulation by microRNA. Cell Research. 22 (1), 107-126 (2012).
  5. Pang, K. C., Frith, M. C., Mattick, J. S. Rapid evolution of noncoding RNAs: Lack of conservation does not mean lack of function. Trends in Genetics. 22 (1), 1-5 (2006).
  6. Guleria, P., Mahajan, M., Bhardwaj, J., Yadav, S. K. Plant small RNAs: biogenesis, mode of action and their roles in abiotic stresses. Genomics, Proteomics and Bioinformatics. 9 (6), 183-199 (2011).
  7. Jones-Rhoades, M. W., Bartel, D. P., Bartel, B. MicroRNAs and their regulatory roles in plants. Annual Review of Plant Biology. 57, 19-53 (2006).
  8. Singh, A., et al. Plant small RNAs: advancement in the understanding of biogenesis and role in plant development. Planta. 248 (3), 545-558 (2018).
  9. Lucas, S. J., Budak, H. Sorting the wheat from the chaff: identifying miRNAs in genomic survey sequences of Triticum aestivum chromosome 1AL. PloS One. 7 (7), 40859 (2012).
  10. Li, S., Castillo-González, C., Yu, B., Zhang, X. The functions of plant small RNAs in development and in stress responses. Plant Journal. 90 (4), 654-670 (2017).
  11. Lee, Y., Jeon, K., Lee, J. T., Kim, S., Kim, V. N. MicroRNA maturation: Stepwise processing and subcellular localization. EMBO Journal. 21 (17), 4663-4670 (2002).
  12. Lee, Y., et al. MicroRNA genes are transcribed by RNA polymerase II. EMBO Journal. 23 (2), 4051-4060 (2004).
  13. Bartel, D. P. MicroRNAs: Genomics, biogenesis, mechanism, and function. Cell. 116 (2), 281-297 (2004).
  14. Lee, Y., et al. The nuclear RNase III Drosha initiates microRNA processing. Nature. 425 (6956), 415-419 (2003).
  15. Meyers, B. C., et al. Criteria for annotation of plant microRNAs. Plant Cell. 20 (12), 3186-3190 (2008).
  16. Sanei, M., Chen, X. Mechanisms of microRNA turnover. Current Opinion in Plant Biology. 27, 199-206 (2015).
  17. Li, J., Yang, Z., Yu, B., Liu, J., Chen, X. Methylation protects miRNAs and siRNAs from a 3′-end uridylation activity in Arabidopsis. Current Biology. 15 (16), 1501-1507 (2005).
  18. Rogers, K., Chen, X. Biogenesis, turnover, and mode of action of plant microRNAs. Plant Cell. 25 (7), 2383-2399 (2013).
  19. Axtell, M. J., Meyers, B. C. Revisiting criteria for plant microRNA annotation in the Era of big data. Plant Cell. 30 (2), 272-284 (2018).
  20. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10 (1), 421 (2009).
  21. Markham, N. R. N., Zuker, M. UNAFold: Software for nucleic acid folding and hybridization. Methods in Molecular Biology. 453, 3-31 (2008).
  22. Alptekin, B., Akpinar, B. A., Budak, H. A comprehensive prescription for plant miRNA identification. Frontiers in Plant Science. 7, 2058 (2017).
  23. Zhang, B., Pan, X., Cannon, C. H., Cobb, G. P., Anderson, T. A. Conservation and divergence of plant microRNA genes. Plant Journal. 46 (2), 243-259 (2006).
  24. Appels, R., et al. Shifting the limits in wheat research and breeding using a fully annotated reference genome. Science. 361 (6403), 7191 (2018).
  25. Wang, Y., Kuang, Z., Li, L., Yang, X. A bioinformatics pipeline to accurately and efficiently analyze the microRNA transcriptomes in plants. Journal of Visualized Experiments: JoVE. (155), e59864 (2020).
  26. Kozomara, A., Griffiths-Jones, S. MiRBase: Annotating high confidence microRNAs using deep sequencing data. Nucleic Acids Research. 42, 68-73 (2014).
  27. Lorenz, R., et al. ViennaRNA Package 2.0. Algorithms for Molecular Biology. 6 (1), 26 (2011).
  28. Wicker, T., et al. Impact of transposable elements on genome structure and evolution in bread wheat. Genome Biology. 19 (1), 103 (2018).
  29. Flavell, R. B., Bennett, M. D., Smith, J. B., Smith, D. B. Genome size and the proportion of repeated nucleotide sequence DNA in plants. Biochemical Genetics. 12 (4), 257-269 (1974).
  30. Wicker, T., et al. The repetitive landscape of the 5100 Mbp barley genome. Mobile DNA. 8, 22 (2017).
  31. Yang, Q., Ye, Q. A., Liu, Y. Mechanism of siRNA production from repetitive DNA. Genes and Development. 29 (5), 526-537 (2015).
  32. Lam, J. K. W., Chow, M. Y. T., Zhang, Y., Leung, S. W. S. siRNA versus miRNA as therapeutics for gene silencing. Molecular Therapy. Nucleic Acids. 4 (9), 252 (2015).
  33. Bartel, B. MicroRNAs directing siRNA biogenesis. Nature Structural and Molecular Biology. 12 (7), 569-571 (2005).
  34. Meng, Y., Shao, C., Wang, H., Chen, M. Are all the miRBase-registered microRNAs true? A structure- and expression-based re-examination in plants. RNA Biology. 9 (3), 249-253 (2012).
  35. Berezikov, E., et al. Evolutionary flux of canonical microRNAs and mirtrons in Drosophila. Nature Genetics. 42 (1), 6-9 (2010).

Перепечатки и разрешения

Запросить разрешение на использование текста или рисунков этого JoVE статьи

Запросить разрешение

Смотреть дополнительные статьи

171

This article has been published

Video Coming Soon

JoVE Logo

Исследования

Образование

О JoVE

Авторские права © 2025 MyJoVE Corporation. Все права защищены