需要订阅 JoVE 才能查看此. 登录或开始免费试用。
Method Article
在这里,我们提出了一种新的全自动miRNA管道mirMachine,它1)可以更准确地识别已知和新型的miRNA,2)是全自动且免费提供的。用户现在可以执行一个简短的提交脚本来运行全自动的 mirMachine 管道。
在不同类型的非编码RNA中,microRNA(miRNA)可以说在过去十年中一直备受关注。作为基因表达的转录后调节因子,miRNA在各种细胞途径中起着关键作用,包括发育和对a/生物胁迫(如干旱和疾病)的反应。拥有高质量的参考基因组序列能够在几种植物物种中鉴定和注释miRNA,其中miRNA序列高度保守。由于计算miRNA鉴定和注释过程大多是容易出错的过程,因此基于同源的预测提高了预测的准确性。在过去的十年中,我们开发并改进了miRNA注释管道SUmir,从那时起,该管道已被用于多个植物基因组。
本研究提出了一种完全自动化的新型miRNA管道mirMachine(miRNA Machine),方法是(i)在二级结构预测上增加额外的过滤步骤,(ii)使其完全自动化,以及(iii)引入新的选项来预测基于同源性的已知miRNA或使用以前的管道基于小RNA测序读数的新型miRNA。新的miRNA管道mirMachine使用拟南芥信息资源TAIR10, 拟南芥 基因组的发布和国际小麦基因组测序联盟(IWGSC)小麦参考基因组v2进行了测试。
下一代测序技术的进步拓宽了对RNA结构和调控元件的理解,揭示了功能上重要的非编码RNA(ncRNA)。在不同类型的ncRNA中,microRNA(miRNA)构成了植物中长度在19至24个核苷酸之间的小RNA的基本调节类别1,2。自从在线虫秀丽隐杆线虫3中发现第一个miRNA以来,miRNA的存在和功能已经在动植物基因组以及4,5,6中得到了广泛的研究。miRNA通过靶向mRNA进行切割或翻译抑制来发挥作用7。越来越多的证据还表明,miRNA参与植物的各种生物过程,包括生长和发育8,自我生物发生9以及几种生物和非生物胁迫反应10。
在植物中,miRNA最初是从称为pri-miRNA11的长初级转录本加工而来的。这些由细胞核内的RNA聚合酶II产生的pri-miRNA是长转录物,形成不完美的折返结构12。pri-miRNA后来经历切割过程,产生miRNA的内源性单链(ss)发夹前体,称为pre-miRNA11。前miRNA形成发夹状结构,其中单链折叠成双链结构以切除miRNA双链(miRNA/miRNA*)13。Dicer样蛋白切割miRNA/miRNA*双链的两条链,留下2-核苷酸3'-突出部14,15。miRNA 双链体在细胞核内甲基化,保护 miRNA 的 3'-末端免受降解和尿苷化活性16,17。解旋酶在输出后解开甲基化的miRNA双链体,并将成熟的miRNA暴露于细胞质中RNA诱导的沉默复合物(RISC)18。双链的一条链是成熟的miRNA并入RISC,而另一条链miRNA*被降解。miRNA-RISC复合物与靶序列结合,导致mRNA在完全互补的情况下降解,或在部分互补的情况下导致翻译抑制13。
基于表达和生物发生特征,已经描述了miRNA注释的指南15,19。根据定义的指南,Lucas和Budak开发了SUmir管道,以在植物9中进行基于同源的计算机miRNA鉴定。SUmir 管道由两个脚本组成:SUmirFind 和 SUmirFold。SUmirFind 通过国家生物技术信息中心 (NCBI) 基本局部比对搜索工具 (BLAST) 筛选对已知的 miRNA 数据集进行相似性搜索,并使用修改后的参数来包括只有 2 个或更少不匹配的命中,并避免偏向较短的命中(blastn-short -unapped -punishment -1 -reward 1)。SUmirFold使用UNAfold 21评估BLAST20结果中推定miRNA序列的二级结构。SUmirFold通过鉴定发夹结构的特征来区分miRNA与小干扰RNA。此外,它通过参数、最小折叠能量指数> 0.67 和 GC 含量 24-71% 来区分 miRNA 与其他 ssRNA(如 tRNA 和 rRNA)。该管道最近进行了更新,增加了两个额外的步骤,以(i)提高灵敏度,(ii)提高注释准确性,以及(iii)提供预测miRNA基因的基因组分布22。鉴于植物miRNA序列23的高度保守性,该管道最初设计用于基于同源的miRNA预测。然而,这种生物信息学分析无法准确鉴定新型miRNA,因为它严重依赖于密切相关物种之间miRNA的序列保守。
本文提出了一种新的全自动miRNA管道mirMachine,它1)可以更准确地识别已知和新型miRNA(例如,该管道现在使用基于sRNA-seq的新型miRNA预测以及基于同源的miRNA鉴定)和2)完全自动化且免费提供。输出还包括预测miRNA的基因组分布。mirMachine在小麦和 拟南芥 基因组中测试了基于同源性和基于sRNA-seq的预测。虽然最初作为自由软件发布,但UNAfold在过去十年中成为商业软件。通过这次升级,二级结构预测工具从UNAfold切换到RNAfold,以便可以免费使用mirMachine。用户现在可以执行一个简短的提交脚本来运行全自动的 mirMachine 管道( 示例在 https://github.com/hbusra/mirMachine.git 中提供)。
1. 软件依赖和安装
2. 幻影机的设置和测试
3. 基于同源性的miRNA鉴定
4. 新型miRNA鉴定
5. 高级参数
注意:为除基因组文件和输入 miRNA 文件之外的所有参数定义默认值。
将上述miRNA管道mirMachine应用于测试数据,以快速评估管道的性能。仅对沉积在miRBase v22.1的高置信度植物miRNA进行了针对IWGSC小麦RefSeq基因组v224的染色体5A进行筛选。mirMachine_find为189个高置信度miRNA的非冗余列表返回了312次命中,最多允许1次错配(表1)。mirMachine_fold根据二级结构评估将其中49种归类为推定的miRNA。代表性最高的miRNA组是miR9666,共鉴定出18个miRNA(
我们的miRNA管线SUmir在过去十年中一直用于鉴定许多植物miRNA。在这里,我们开发了一种新的、全自动的、免费提供的miRNA鉴定和注释管道mirMachine。此外,许多miRNA鉴定管道,包括但不限于以前的管道,都依赖于UNAfold软件21,该软件随着时间的推移成为商业软件,尽管曾经免费提供。这种新的全自动 mirMachine 不再依赖于 UNAfold;相反,来自ViennaRNA包27 的免费RNAfold用?...
Name | Company | Catalog Number | Comments |
https://www.ncbi.nlm.nih.gov/books/NBK279671/ | Blast+ | ||
https://github.com/hbusra/mirMachine.git | mirMachine submission script | ||
https://www.perl.org/get.html | Perl | ||
https://www.tbi.univie.ac.at/RNA/ | RNAfold | ||
Arabidopsis TAIR10 | |||
Triticum aestivum (wheat, IWGSC RefSeq v2) |
请求许可使用此 JoVE 文章的文本或图形
请求许可This article has been published
Video Coming Soon
版权所属 © 2025 MyJoVE 公司版权所有,本公司不涉及任何医疗业务和医疗服务。