Method Article
靶向交联质谱使用使用多达三种不同采集方案获取的质谱数据创建季铵盐蛋白质结构模型。当在Cheetah-MS Web服务器上作为简化的工作流程执行时,结果将在Jupyter Notebook中报告。在这里,我们演示了如何扩展Jupyter Notebook以进行更深入分析的技术方面。
蛋白质 - 蛋白质相互作用可能具有挑战性,但可以提供对生物系统如何运作的见解。靶向交联质谱(TX-MS)是一种结合四元蛋白质结构建模和化学交联质谱的方法,使用从复杂,不均匀的样品中获得的数据创建高精度结构模型。这消除了蛋白质复合物结构分析的主要障碍之一,因为感兴趣的蛋白质不再需要大量纯化。猎豹-MS网络服务器的开发是为了使社区的协议的简化版本更容易访问。考虑到串联的MS/MS数据,Cheetah-MS生成了一个Jupyter Notebook,这是一份图形报告,总结了最重要的分析结果。扩展Jupyter Notebook可以产生更深入的见解,并更好地了解模型和支持它的质谱数据。这里介绍的技术协议演示了一些最常见的扩展,并解释了可以获得哪些信息。它包含的模块有助于分析串联MS / MS采集数据以及检测到的XL对报告的四元模型的总体影响。此类分析的结果可以应用于使用 NGLView 嵌入在笔记本中的结构模型。
蛋白质-蛋白质相互作用是生物系统结构和功能的基础。获得蛋白质的四级结构可以提供关于两种或多种蛋白质如何相互作用形成高阶结构的见解。不幸的是,获得第四纪结构仍然具有挑战性。这反映在相对较少数量的蛋白质数据库(PDB)条目1中,其中包含一种以上的多肽。蛋白质 - 蛋白质相互作用可以通过X射线晶体学,NMR和冷冻电镜等技术进行研究,但是在可以应用这些方法的条件下获得足够量的纯化蛋白质可能非常耗时。
开发了化学交联质谱法,以获得蛋白质 - 蛋白质相互作用的实验数据,同时减少对样品制备的限制,因为质谱法可用于获取任意复杂样品的数据2,3,4,5,6,7,8,9.然而,数据分析的组合性质和相对较少的交联肽要求在分析之前对样品进行分馏。为了解决这一缺点,我们开发了TX-MS,这是一种将计算建模与化学交联质谱10相结合的方法。TX-MS可用于任意复杂的样品,并且与以前的方法10相比,灵敏度要高得多。它通过将与给定蛋白质 - 蛋白质相互作用相关的所有数据作为一个集合进行评分来实现这一点,而不是独立解释每个MS谱。TX-MS还使用多达三种不同的MS采集协议:高分辨率MS1(hrMS1),数据依赖采集(DDA)和数据独立采集(DIA),进一步提供了通过结合多个观察结果来鉴定交联肽的机会。TX-MS计算工作流程很复杂,原因有几个。首先,它依靠多个MS分析软件程序11、12、13来创建蛋白质结构模型14、15。其次,数据量可能相当可观。第三,建模步骤会消耗大量的计算机处理能力。
因此,TX-MS最好通过Cheetah-MS Web服务器16用作自动化,简化的计算工作流程,该服务器在大型计算基础设施(如计算机云或集群)上运行。为了便于解释结果,我们制作了一个交互式Jupyter Notebook17。在这里,我们演示了如何扩展Jupyter Notebook报告,以对给定结果进行更深入的分析。
1. 在 https://txms.org 提交工作流。
2. 运行猎豹-MS。
注意:使用 ProteoWizard MSConvert 软件将供应商特定的格式转换为 mzML 或 MGF19。
3. 安装 JupyterHub。
4. 下载报告。
5. 扩展报表。
TX-MS 提供由 MS 派生的实验约束支持的结构输出。它的工作原理是将不同的MS数据采集类型与计算建模相结合。因此,单独解析每个MS数据并提供输出结构的可视化是有帮助的。 补充数据 1 包含一个示例笔记本,可以解析作为 TX-MS 输出生成的 DDA 和 DIA 数据。用户可以选择感兴趣的XL。通过运行笔记本,将显示该XL的MS2光谱,其中不同的颜色有助于区分与第一肽,第二肽和组合片段离子相关的片段。XL还可以使用嵌入在Jupyter Notebook中的NGLView小部件映射到结构。
此笔记本中的另一个单元格可以帮助用户分析和可视化 DIA 数据。但是,可视化 DIA 数据更加困难,因为分析的数据需要以正确的格式进行准备。
图1 显示了M1和白蛋白的示例结构,其顶部XL映射在该结构上。TX-MS在解析hrMS1,DDA和DIA数据后获得了所有XL,RosettaDock协议提供了计算模型。
由于此报表是 Jupyter 笔记本,因此可以将任何有效的 Python 代码添加到新的笔记本单元格中。例如,下面的代码将创建一个基于 MS2 计数的直方图,指示基础数据对每个交叉链接的支持程度。
进口海生生物作为sns
sns.distplot(ms2['count']);
图1: 化脓性链球菌 M1 蛋白和人白蛋白的结构模型,结构上映射了XL。 M1蛋白以灰色显示,构成同源二聚体。六种白蛋白分子以各种深浅不一的蓝色成对呈现。交叉链接和距离以红色和黑色文本给出。 请点击此处查看此图的大图。
补充文件。Jupyter notebook data.请点击此处下载此文件。
现代计算工作流程通常很复杂,具有来自许多不同供应商的多个工具,复杂的相互依赖性,高数据量和多方面的结果。因此,越来越难以准确记录获得结果所需的所有步骤,因此难以重现给定的结果。在这里,我们将演示一种通用策略,该策略将生成通用报表的自动化工作流的自动化和易用性与以可重现的方式自定义报表的灵活性相结合。
方案需要满足三个要求才能发挥作用:首先,选择用于分析的蛋白质需要以这样的方式相互作用,即化学交联实验能够以足够高的浓度产生交联物质,以便由质谱仪检测;不同的质谱仪具有不同的检测水平,并且还取决于采集方案以及交联试剂的选择。当前版本的TX-MS方案仅允许DSS,一种赖氨酸 - 赖氨酸同源双官能交联试剂。尽管如此,这种限制主要是由于机器学习步骤可能需要针对其他试剂进行调整。这种限制在Cheetah-MS网络服务器中得到了改善,因为可以考虑另外两种交联试剂,但所有三种都是不可切割的试剂。其次,这两种蛋白质需要具有实验确定的结构,或者使用比较建模技术或 从头 技术进行建模。并非所有蛋白质都可以建模,但是改进的软件和PDB中实验结构的恒定沉积的组合扩展了可以建模的蛋白质数量。第三,相互作用的蛋白质应该在它们的结合和未结合状态下保持足够相似,以便TX-MS和Cheetah-MS使用的对接算法可以创建足够质量的四元结构来实现评分。这一要求相对模糊,因为可接受的质量是高度系统依赖性的,其中已知结构的较小蛋白质通常比未知结构的大型蛋白质更容易比较。
如果结果为阴性,首先检查TX-MS是否发现了作为同一多肽链一部分的残基之间的内链,交联。如果没有发现,最可能的解释是样品制备或数据采集出现问题。如果多个距离约束不支持模型,请目视检查模型以确保构象由交联残差支持。没有明显的方法可以在不中断至少一个交联的情况下使其中一个交互者枢轴。如果交联的交联时间长于给定交联试剂的允许距离,请尝试通过合并交联数据来改进相互作用子的建模。
可以使用替代软件应用程序来完成等效的结果,前提是所选软件的灵敏度与TX-MS的灵敏度相当。例如,有RosettaDock,HADDOCK等的在线版本。还可以通过xQuest/xProphet5,6,plink7和SIM-XL26分析化学交联数据。
我们不断将TX-MS和Cheetah-MS应用于新项目27,28,29,从而改进了这些方法生成的报告,以便在不扩大报告的情况下对结果进行更详细的分析。
作者没有什么可透露的。
这项工作得到了Knut和Alice Wallenberg基金会(拨款编号:2016.0023)和瑞士国家科学基金会(拨款编号:2016.0023)的支持。P2ZHP3_191289)。此外,我们感谢苏黎世大学S3IT的计算基础设施和技术支持。
Name | Company | Catalog Number | Comments |
Two Protein DataBank files of the proteins of interest. | N/A | N/A | Example files available on txms.org and zenodo.org, DOI 10.5281/zenodo.3361621 |
An mzML data file acquired on a sample where the proteins of interest were crosslinked. | N/A | N/A | Example files available on txms.org or zenodo.org, DOI 10.5281/zenodo.3361621 |
请求许可使用此 JoVE 文章的文本或图形
请求许可This article has been published
Video Coming Soon
版权所属 © 2025 MyJoVE 公司版权所有,本公司不涉及任何医疗业务和医疗服务。