这里描述的方案提供了有关在用户友好的UCSC基因组浏览器上使用phyloCSF分析蛋白质编码电位的感兴趣基因组区域的详细说明。PhloCSF可以有效地识别在基因组区域中具有微蛋白编码潜力的保守短开放阅读框,这些区域目前被注释为非编码。这里描述的方法易于使用,并且可以由所有背景的研究人员实施,而无需事先接受过生物信息学或比较基因组学方面的培训或专业知识。
首先,打开互联网浏览器窗口并导航到加州大学圣克鲁兹分校或UCSC基因组浏览器。在我们的工具标题下,选择轨道中心选项。在“公共中心”选项卡中,在搜索词框中键入 phyloCSF。
然后,单击搜索公共中心按钮。通过单击集线器名称“系统”的“连接”按钮连接到系统类。单击“连接”后,等待重定向到UCSC基因组浏览器网关页面。
要查询其他物种,请在浏览下选择感兴趣的物种,或通过单击相应的图标选择物种标题,或者在文本框中输入物种,输入物种通用名称或程序集ID。到基因组浏览器上感兴趣的基因。如果搜索结果有多个匹配项等待重定向到需要选择感兴趣位置的页面,请单击相应的感兴趣基因。导航到UCSC基因组浏览器后,选择我们的工具标题下的爆炸样比对工具或blat来查询特定的DNA或蛋白质序列。
或者,将光标悬停在工具选项卡上,然后选择 blat 选项或按照给定的链接进行操作。使用下拉菜单选择感兴趣的物种,基因组和组装。然后,定义查询类型,将感兴趣的序列粘贴到 blat 搜索基因组文本框中,然后单击“提交”。
接下来,单击操作标题下的浏览器链接以导航到感兴趣的基因组区域。目视扫描感兴趣的基因组区域,以找到正评分的门类CSF区域。使用缩放功能放大感兴趣的区域以检查序列特征并搜索开始和停止密码子。
要手动放大,请按住 Shift 键,然后单击并按住鼠标按钮,同时沿感兴趣区域拖动。或者,使用页面顶部的放大和缩小按钮进行导航。放大,直到核苷酸或碱基序列可见。
目视扫描正评分的 phyloCSF 区域开始和结束附近的核潮汐序列,以识别惩罚性起始和停止密码子。将鼠标光标悬停在页面顶部的视图标题上,然后单击“其他基因组转换”选项,然后使用新基因组标题下方的下拉菜单定义感兴趣的基因组。在新程序集标题下选择感兴趣的基因组程序集,然后单击提交按钮。
一旦浏览器返回新程序集中具有相似性的区域列表。单击染色体位置链接以导航到感兴趣的同源区域。按照前面描述的导航策略来分析序列。
要导航到基因描述页面,请在UCSC基因组浏览器的基因代码跟踪中单击感兴趣的基因。在序列和指向工具和数据库标题的链接下,单击表中的链接,该链接可以更快地读取其他物种。单击与感兴趣物种关联的框以选择它们。
然后,单击“提交”。将页面底部显示的序列以更快的格式复制并粘贴到字处理文档中。接下来,打开第二个浏览器窗口,导航到欧洲生物信息学研究所网站上的克隆欧米茄多序列比对工具。
将剪贴板上的序列文件粘贴到步骤 1 中的框中,该框以任何受支持的格式读取序列。滚动到页面底部,然后单击提交。观察对齐结果下方指示每个氨基酸保守程度的符号。
要查看氨基酸属性和颜色,请单击序列正上方的显示颜色链接,以根据其属性对氨基酸进行着色。然后将序列对齐方式复制并粘贴到文字处理或幻灯片放映程序中,以生成图形或插图文件。要查看来自封闭式欧米茄结果页面的其他输出,请单击选项卡指南树或门系遗传树。
最后,单击结果查看器的选项卡以获取选项,以使用jalview查看序列信息或访问mview和简单系统发育的直接链接。对米托谷蛋白基因的代表性系统CSF分析表明,与经过验证的微蛋白相对应的高序列保守区域。完整的米托雷古林编码序列包含在外显子1中,并且在phyloCSF减去一个轨道上得分非常高。
在 phyloCSF 中正评分区域的开头可以观察到保守的起始密码子减去一条轨迹。米托雷古林第一个外显子中的正评分区域直接在起始密码子上开始,并在终止密码子处终止。这里显示了八种不同物种的微蛋白米托菌素的多序列比对。
对长非编码RNA热空气的分析显示,在所有六条磁道上,整个基因的得分均为负数,表明缺乏序列保存,并支持热空气被正确注释为非编码RNA。PhyloCSF对小鼠一、八、一、零、零、五、八、I 24 rike基因的分析表明,一个保守的开放阅读框跨越三个外显子,正系统CSF评分从外显子一的加二轨道跳到外显子二中的加三轨道,然后回到外显子三中的加二轨道。对满足一个基因位点的PhyloCSF分析也有效地用于鉴定单个RNA分子内的多个不同的编码开放阅读框。
重要的是要注意,虽然阳性的phyloCSF评分高度提示微蛋白编码能力,但这一系列证据不能单独存在,必须经过实验验证。一旦确定了一段时间的微蛋白,就可以分析氨基酸序列的保守结构域或序列特征,以深入了解其功能。PhyloCSF已被有效地用于鉴定基因组区域中以前被认为是非编码的新型微蛋白,并将继续成为未来微蛋白鉴定研究中的有用工具。