OpenProt 是第一个允许对真核基因组进行多系统电子注释的数据库,它识别原基因的编码潜力,并能够发现以前无法检测的蛋白质。我们设计了这个协议,以便所有用户都能访问它,而不需要广泛的生物信息学技能,它基本上把蛋白质组发现都掌握在任何人的掌握之中。为了理解和应对当今医学挑战,我们需要充分了解蛋白质组学的格局和所有演员及其动态。
OpenProt 提供了这种可能性。虽然在这里,OpenProt用于分析蛋白质实验,它也可以与其他系统一起使用,因为它只是提供了蛋白质组更清晰的定义。首先打开 OpenProt 网站,并使用顶部页面菜单中的链接打开下载页面。
根据分析的实验数据和所需的蛋白质类型,点击感兴趣的物种。单击 AllProts、异构体和 RefProds 生成包含 OpenProt 数据库中存在的所有已知和新颖蛋白质类型的文件,如果可用,请单击从中绘制蛋白质序列的注释。根据研究目标,点击蛋白质考虑所需的支持证据水平。
然后单击,所有预测生成包含所有 OpenProt 预测的文件,然后单击所需的文件格式下载。对于蛋白质组,选择 FASTA 蛋白文件。readme 文件将包含有关文件格式的所有必要信息。
对于数据库处理,登录到适当的蛋白质组工具实例并创建新的历史记录。要导入下载的 OpenProt 数据库,请单击"上传"。要输入数据库处理工作流,请转到工作流页面,再次单击"再次上传",然后单击运行工作流。
然后选择导入的 OpenProt 数据库作为输入,然后将获取的 Fasta 文件重命名为有意义的文件。该数据库可用于蛋白质组学分析。对于质谱文件准备,请打开 proteo 向导套件中免费提供的 MS 转换工具并上传要分析的数据文件。
选择输出目录,将所需的文件格式设置为 mzML,然后根据质谱第 1 和 2 级使用基于波莱特的算法来选择峰值拾取滤波器并开始转换。对于蛋白质定量,创建新历史记录,然后将以前创建的数据库拖下拖到新历史记录中。单击"上传"导入转换后的 mzML 数据文件。
打开工作流页面,再次单击"上传"导入所需的工作流,然后选择运行工作流以查看不同的参数。选择导入的 mzML 数据文件,然后输入以前创建的数据库作为数据库 Fasta 文件。因为工作流使用 X!
Tandem 搜索引擎,点击上传导入 X !串联默认配置文件。为了说明使用整个 OpenProt 数据时的大小会显著增加,请使用严格的错误发现率。
对于质量控制,在 ID 筛选器输出上运行文件信息工具,以提供常见的性能指标,例如肽谱匹配的数量或已识别的肽和蛋白质的数量。对于 OpenProt 数据库挖掘,返回到 OpenProt 网站并打开搜索页面。单击识别蛋白质感兴趣的物种,并在蛋白质查询框中输入蛋白质加入编号。
单击浪涌,将显示一个包含查询蛋白质基本信息的表。接下来,单击详细信息链接。新打开的页面将包含一个以查询的蛋白质为中心的基因组浏览器以及其他信息。
要获取蛋白质或DNA序列,请分别单击信息选项卡中的蛋白质或DNA链接,然后单击标签,浏览有关质谱证据核糖体分析检测、保存和识别蛋白质域的详细信息。在这份代表分析中,原始论文中确定的主要蛋白质也是使用 OpenProt 2_pep 或 OpenProt_all 数据库确定的,这表明 OpenProt 数据库能够产生与基于 InterPro KB 数据库的当前程序相当的蛋白质识别和定量。使用 OpenProt 数据库,所有数据集中都使用自信的肽识别了 11 种目前尚未在数据库中注释的受良好支持的蛋白质2_pep。
使用该数据库的 29 种新蛋白质,使用自信的肽OpenProt_all蛋白质。建议的严格假发现率并不影响最自信的蛋白质鉴定,尽管确实减少了已识别蛋白质的总数。一种新的蛋白质被发现作为Raf-1蛋白的相互作用者。
这种蛋白质以前没有通过质谱或核糖体分析检测过,并表现出良好的光谱质量。请记住,确保所选参数足以用于实验设计,并在报告新的蛋白质发现时始终验证运动证据的质量。该协议适用于所有自上而下的蛋白质组学实验,特别是与功能蛋白质组学一起使用时。
这将允许对蛋白质相互作用和细胞通路进行深入的筛选和理解。OpenProt 突出了对当前基因组符号所传递的突起景观的实质性低估,并强调了真核基因的多晶硅性质。这是一个全新的研究途径。
该协议的美妙是,它不需要广泛的生物信息技能,因为它使用远程服务器,它可以在任何计算机上运行。