需要订阅 JoVE 才能查看此. 登录或开始免费试用。
Method Article
* 这些作者具有相同的贡献
翻译核糖体将每个密码子的三个核苷酸解码为肽。它们沿着mRNA的运动,通过核糖体分析捕获,产生表现出特征性三重态周期性的足迹。该协议描述了如何使用RiboCode从核糖体分析数据中破译这一突出特征,以识别全转录组水平上主动翻译的开放阅读框。
识别开放阅读框(ORF),特别是那些编码小肽并在特定生理环境下被积极翻译的阅读框,对于上下文依赖性翻译组的全面注释至关重要。核糖体分析是一种检测RNA上翻译核糖体的结合位置和密度的技术,为快速发现全基因组范围内翻译发生的位置提供了一条途径。然而,在生物信息学中,高效、全面地鉴定用于核糖体分析的转化ORFs并非易事。这里描述的是一个易于使用的包,名为RiboCode,旨在从核糖体分析数据中的失真和模糊信号中搜索任何大小的ORF。本文以我们之前发布的数据集为例,提供了整个RiboCode管道的分步说明,从原始数据的预处理到最终输出结果文件的解释。此外,为了评估注释ORF的平移率,还详细描述了每个ORF上核糖体密度的可视化和定量程序。综上所述,本文是对翻译、小ORF和肽相关研究领域的有用和及时的指导。
最近,越来越多的研究表明,从编码基因的ORF和先前注释的基因翻译的肽被广泛生产为非编码基因,例如长非编码RNA(lncRNA)1,2,3,4,5,6,7,8。这些翻译的ORF由细胞调节或诱导,以响应环境变化,压力和细胞分化1,8,9,10,11,12,13。一些ORF的转化产物已被证明在发育和生理学中的各种生物过程中起着重要的调节作用。例如,Chng等人14发现了一种名为Elabela(Ela,也称为Apela / Ende / Toddler)的肽激素,它对心血管发育至关重要。Pauli等人认为Ela还充当有丝分裂原,促进早期鱼胚胎中的细胞迁移15。Magny等人报道了两种少于30个氨基酸的微肽调节钙转运并影响果蝇心脏的正常肌肉收缩10。
目前尚不清楚基因组编码了多少这样的肽,以及它们是否具有生物学相关性。因此,系统地识别这些潜在编码的ORF是非常可取的。然而,使用进化守恒16,17和质谱18,19等传统方法直接确定这些ORF(即蛋白质或肽)的产物具有挑战性,因为这两种方法的检测效率都取决于所产生的蛋白质或肽的长度,丰度和氨基酸组成。核糖体分析是一种在核苷酸分辨率下鉴定mRNA上核糖体占用的技术,它的出现为评估不同转录本的编码潜力提供了一种精确的方法3,20,21,无论它们的长度和组成如何。使用核糖体分析鉴定主动翻译ORF的一个重要且常用的特征是核糖体从起始密码子到停止密码子在mRNA上的足迹的三核苷酸(3-nt)周期性。然而,核糖体分析数据通常存在几个问题,包括沿ORF的低和稀疏测序读数,高测序噪声和核糖体RNA(rRNA)污染。因此,这些数据产生的扭曲和模糊信号削弱了核糖体在mRNA上足迹的3-nt周期模式,最终使得高置信翻译ORFs的鉴定变得困难。
一个名为"RiboCode"的软件包采用了改进的Wilcoxon签名秩测试和P值积分策略,以检查ORF是否比帧外RPF具有更多的帧内核糖体保护片段(RPM)22。它被证明对于模拟和真实核糖体分析数据中翻译组的 从头 注释是高效,灵敏和准确的。在这里,我们描述了如何使用该工具从先前研究生成的原始核糖体分析测序数据集中检测潜在的转化ORF23。这些数据集用于通过比较MCF-10A细胞的核糖体占用谱来探索EIF3亚基"E"(EIF3E)在翻译中的功能,这些细胞转染对照(si-Ctrl)和 EIF3E (si-eIF3e)小干扰RNA(siRNA)。通过将RiboCode应用于这些示例数据集,我们检测到5,633个可能编码小肽或蛋白质的新型ORF。这些ORF根据其相对于编码区域的位置分为各种类型,包括上游ORF(uORFs),下游ORF(dORFs),重叠ORF,来自新型蛋白质编码基因(新型PCG)的ORF以及来自新型非蛋白编码基因(新型NonPCGs)的ORF。与对照细胞相比,EIF3E缺陷细胞中uORFs上的RPF读数密度显着增加,这可能至少部分是由主动翻译核糖体的富集引起的。EIF3E缺陷细胞第25~ 75个 密码子区域的局部核糖体积累表明早期翻译伸长受阻。该协议还展示了如何可视化所需区域的RPF密度,以检查已识别ORF上核糖体足迹的3-nt周期模式。这些分析证明了RiboCode在识别翻译ORF和研究翻译监管方面的强大作用。
1. 环境设置和 RiboCode 安装
2. 数据准备
3. 修剪适配器并去除 rRNA 污染
4. 将干净的读数与基因组对齐
5. RPF的大小选择及其P站点的识别
6 . 从头开始 注释翻译ORF
7. (可选)ORF 定量和统计
8. (可选)预测 ORF 的可视化
9. (可选)使用核糖矿工进行元基因分析
注意:执行元基因分析,以评估 EIF3E 敲低对已识别的注释ORF的翻译的影响,请按照以下步骤进行:
将示例核糖体分析数据集存入GEO数据库,加入号为GSE131074。此协议中使用的所有文件和代码均可从补充文件 1-4 获得。通过将RiboCode应用于一组已发表的核糖体分析数据集23,我们确定了在用对照和EIF3E siRNA处理的MCF-10A细胞中主动翻译的新型ORF。为了选择最有可能被翻译核糖体结合的RPF读数,检查了测序读数的长度,并使用映射在已知?...
核糖体分析为在基因组尺度上研究核糖体在细胞中的作用提供了前所未有的机会。精确破译核糖体分析数据携带的信息可以深入了解基因或转录本的哪些区域正在积极翻译。此分步协议提供了有关如何使用 RiboCode 详细分析核糖体分析数据的指导,包括软件包安装、数据准备、命令执行、结果说明和数据可视化。RiboCode的分析结果表明,翻译是普遍存在的,并且发生在编码基因的未注释ORF和许多先?...
作者没有利益冲突需要披露。
作者要感谢西安交通大学HPCC平台提供的计算资源的支持。Z.X.衷心感谢西安交通大学青年顶尖人才支持计划。
Name | Company | Catalog Number | Comments |
A computer/server running Linux | Any | - | - |
Anaconda or Miniconda | Anaconda | - | Anaconda: https://www.anaconda.com; Miniconda:https://docs.conda.io/en/latest/miniconda.html |
R | R Foundation | - | https://www.r-project.org/ |
Rstudio | Rstudio | - | https://www.rstudio.com/ |
请求许可使用此 JoVE 文章的文本或图形
请求许可This article has been published
Video Coming Soon
版权所属 © 2025 MyJoVE 公司版权所有,本公司不涉及任何医疗业务和医疗服务。