Method Article
介绍了使用Bio3D-web在线调查蛋白质序列结构 - 动力学关系的协议。
我们展示了Bio3D-Web在生物分子结构数据交互式分析中的应用。 Bio3D-Web应用程序提供在线功能:(1)将相关蛋白质结构集合识别为用户指定的相似阈值; (2)它们的多重对齐和结构叠加; (3)序列和结构守恒分析; (4)主成分分析的构象间关系映射,(5)通过整体正态分析比较预测的内部动力学。该集成功能提供了一个完整的在线工作流程,用于调查蛋白质家族和超家族中的序列结构 - 动态关系。
蛋白质数据库(PDB)现在包含超过120,000个蛋白质结构 - 其中许多蛋白质家族具有相同的蛋白质家族,但在不同的实验条件下被解析。这些多重结构代表了理解蛋白质形式和功能复杂性的宝贵资源。例如,这些结构合奏的严格的比较可以揭示重要的分子机制1,2,3,并通知上涉及过程,包括配体结合,酶催化和双分子识别4,5,6,7构象动力学。通常可以从蛋白质家族的序列,结构和动力学的详细的大规模分析中获得新的见解。然而,这通常需要相当大的生物ormatics和计算机程序设计专业知识,以及对正在研究的蛋白质系统的熟悉程度。例如,软件包如Bio3D,PRODY和Maven需要在R,蟒和Matlab,分别为8,9,10编程。相反,对于结构灵活性分析的在线工具一般仅限于个别结构11的调查,12。这方面的一个例外是最近开发的WebNM @服务器,其允许比较从几个预对齐用户指定结构13的正常模式分析(NMA)获得的灵活性模式。然而,该服务器缺少自动化程序来识别用于比较的结构,它们的对准或超出NMA的进一步分析。另一个最近的贡献是在线PDBFlex数据库,其中提供了c共享95%或更高序列同一性的PDB结构的有限分析14 。然而,目前尚不能分析更多样化的结构集。
我们以前介绍过Bio3D-web - 一个易于使用的Web应用程序,用于分析蛋白质序列结构 - 动态关系15 。 Bio3D-web是提供易于使用的集成功能,用于在线大型同源结构集的识别,比较和详细分析。在这里,我们提出了使用Bio3D-web在线调查蛋白质序列结构 - 动力学关系的详细协议。 Bio3D-web提供了多种功能,支持图1所示的五个主要步骤的数据分析,并在下面详细讨论。这些步骤构成了从查询序列或结构输入,跨序列结构动态分析的多个级别到总结的工作流程y报告生成。通过广泛的浏览器可视化和绘图设备,以及通过以常用格式下载结果文件,可以立即获得结果。除了方便易用的动态界面,用于探索参数和方法选择的影响,Bio3D-web还将用户会话的完整用户输入和后续图形结果记录为PDF,DOC和HTML格式的可共享的可重复报告。用户会话可以在以后的时间保存和重新加载,并在用户的本地计算机上通过Bio3D R软件包下载并进一步解释完整的结果。
Bio3D幅材由Bio3Dř包生物分子的结构,序列和分子模拟数据8,16的分析供电。特别是用于刚性核识别的Bio3D算法 8 ,叠加,主成分分析(PCA) 8 ,集合正常模式分析(eNMA) 16构成了应用的基础。我们还使用依赖于pHMMER 17的 Bio3D方案来鉴定相关的蛋白质结构,并且使用MUSCLE 18进行多重序列比对。结构和序列注释通过来自RCSB PDB 19和PFAM数据库20的 Bio3D实用程序得到。 Bio3D-web可以从我们的在线服务器运行,也可以在任何运行R的计算机上安装。Bio3D-web对所有用户都是开放的,根据GPL-3开源许可证免费提供:http:// thegrantlab。组织/ bio3d / webapps中
注意:典型的Bio3D-web会话通过五个连续和相关的步骤进行(参见图1的示意图)。每个步骤被实现为Web应用程序的连续导航选项卡,即SEARCH,ALIGN,FIT,PCA和eNMA。
结构搜索与选择(SEARCH)
2。多序列比对分析(ALIGN)
3.结构配套与分析(FIT)
主成分分析(PCA)
正常模式分析(eNMA)
腺苷酸激酶(Adk)是普遍存在的酶,其功能是维持许多细胞过程所必需的细胞质核苷酸之间的平衡。 Adk通过催化磷酰基从ATP向AMP的可逆转移而起作用。该反应是伴随着充分研究的速率限制的构象转变3,21。在这里,我们使用Bio3D-web分析目前可用的所有Adk结构,以揭示这些基本过渡的详细功能和机制原理。
我们可以通过输入任何已知的Adk结构的RCSB PDB代码开始对Adk的Bio3D-web分析。例如,在"搜索"选项卡的面板A中输入PDB ID 1AKE会返回167个序列相似的结构,从中自动选择顶部26进行进一步分析(见图B)。注释存在在图C中表示这些选定的结构全部来自大肠杆菌,通过在一定范围的空间组中的x射线衍射来求解;分辨率范围为1.63至2.8Å,并与一系列不同的配体(不含配体,AMP,ADP,MG和抑制剂AP5)共结晶。请注意,通过单击面板C中的"显示/隐藏列"选项可以显示附加注释详细信息。
进入ALIGN选项卡时执行多序列对齐。 ALIGN选项卡的第一个面板显示对齐的摘要,提供有关序列行数(相当于PDB结构数)的详细信息以及位置数( 即对齐列)。这包括间隙数和非间隙数列的规格。第一行右侧的图提供了序列比对的示意图。这里e灰色区域表示非间隙位置,而对齐的白色区域对应于间隙。序列保守性的表示在与指示保守位置的红色区域的对准之上显示,并且白色表示较不守恒。注意,该图中的序列是基于它们在左侧的聚类树形图提供的相似性来排序的。该选项卡的第二个面板进一步促进了所选PDB的聚类,这些PDB基于它们的成对序列相似性,可以将其视为树形图或热图。默认情况下,显示了表示簇的布置的树形图(或树形图)。树形图的y轴表示簇之间的距离(以序列同一性计)。
进入FIT标签后,会自动执行结构叠加。叠加结构,在面板A中交互显示,indic考虑到相对刚性的核心区域的存在(包括残留1-29,68-117和161-214;有关详细信息,请参阅FIT选项卡底部的"可选核心和RMSD详细信息"面板)。另外两个可变的核苷酸结合区(残基30-67和118-167)也清晰可见( 图2 )。基于RMSD的聚类将这些结构分成两个不同的构象。
单击PCA选项卡更清楚地显示了这些结构之间的关系,这些位置在有效结合相关结构中的结合核苷酸物种( 图2B和2C )的位置。大多数结构是"封闭"形式( 图2C中的蓝色)并且与结合的配体或抑制剂相关联。相比之下,更多的"开放"构型是核苷酸和不含抑制剂的。这是一致的对Adk结构和动力学的广泛研究表明,这些区域的开放构型对于核苷酸结合是需要的,并且是有效的磷酰基转移和抑制有害水解事件的封闭构象。值得注意的是,单个PC捕获该Adk结构集合中总平均位移的97%,并且提供了开放到闭合过渡的明确和引人注目的描述以及对该功能位移的各个残差贡献(应用的面板C)和图2 )。
访问NMA选项卡并增加考虑计算的结构数量(通过减少过滤类似结构的截止值)表明,与封闭形式结构相比,开放状态结构显示增强的局部和全局动力学( 图2D和应用程序面板C) 。比较PCA和NMA的结果单个结构(图D)表示所有开放式结构的第一种模式与PC1显示相对较高的重叠(平均值为0.37±0.04)。相比之下,封闭形式的结构显示较低的值(平均值为0.30±0.01)。开放式结构的RMSIP值(0.62±0.003)也高于封闭结构(0.56±0.008)。此外,重叠分析表明,开放状态的第一种模式与描述开放和关闭状态差异的构象变化(图E)非常一致。基于RMSIP值的聚类再次显示了打开和关闭状态结构的一致分区(图F)。
这些结果总体上表明Adk存在两个主要的不同构象状态。这两个不同之处在于显示出不同柔性的两个核苷酸结合位点区域的低频位移核苷酸结合后的遗传。
图1: 具有PCA和NMA选项卡屏幕截图的Bio3D- Web概述。 Bio3D-web将用户提供的蛋白质结构或序列作为SEARCH选项卡( 1 )中的输入。服务器提供相关结构的列表,可以选择进行进一步分析。 ( 2 )ALIGN标签提供了在SEARCH选项卡中选择的结构的序列比对和分析。 ( 3 )在FIT标签中,所有的结构与传统的成对结构分析的结果一起叠加和可视化。 ( 4 )结构集合的主成分分析在PCA选项卡中进行,以表征构象间关系。 ( 5 )每个结构的正常模式分析可以在eNMA标签中进行探索可用结构状态的动态趋势。 请点击此处查看此图的较大版本。
图2: 腺苷酸激酶的Bio3D-web分析结果。 ( A )叠加在确定的不变核上的腺苷酸激酶的可用PDB结构。结构根据FIT选项卡中提供的基于RMSD的聚类进行着色。 ( B )主成分的可视化可从PCA选项卡中获取,以表征数据集中的主要构象变化。这里,对应于第一主成分的轨迹以管表示的方式示出,表示蛋白质的大规模闭合运动。 ( C )结构在形成图中的两个第一主要成分上,显示构象变异性的低维表示。每个点(或结构)根据用户指定的标准进行着色,在这种情况下是基于PCA的聚类结果。 ( D )eNMA标签中的正常模式分析表明,与封闭形式(蓝色)结构相比,打开状态(红色)中结构的局部和全局动力学增强。 请点击此处查看此图的较大版本。
Bio3D-web可用于交互式探索并绘制来自可用晶体结构的蛋白质的结构,动态和功能状态。此外,基于NMA和PCA的聚类结果以及注释和基于序列的分析可以特别适用于选择代表性结构以进行更耗时的分析,例如整体小分子对接或分子动力学模拟。因此,Bio3D-web通过减少所需的技术专长水平,为更广泛的研究人员提供先进的结构生物信息学分析。 Bio3D-web的当前设计强调简单易懂,包含完整的独立Bio3D包中可用的许多分析方法。在许多情况下,设想研究人员将使用Bio3D-web来了解其蛋白质家族或感兴趣的超家族的总体趋势,然后可以提供更专业的分析。 Bio3D-web是重新设计用于快速探索生物分子结构数据集并充当假设生成工具。我们鼓励用户通过在可重复报告中提供示例Bio3D代码来进一步探索其数据,该代码也存储所有查询详细信息和分析结果。
在上述代表性的示例协议中,我们展示了Bio3D-web揭示Adk功能构象转换的结构特征的能力。 Bio3D-web的其他应用包括用户上传的PDB结构的结构和动力学分析。例如,用户可以上传新的结构或确实的蛋白质序列进行分析。前面提到的分析步骤,特别是eNMA步骤,可以揭示蛋白质运动的局部和全球趋势,集体运动具有功能意义。与apo结构的比较也可以揭示未绑定到构象转换的特征。应用的其他示例在线提供了一系列不同的蛋白质家族。
尽管所有蛋白质都是灵活和动态的实体,但并非所有蛋白质都具有在不同状态( 例如活性和非活性状态)范围内可用的原子分辨率结构。因此,我们对蛋白质结构空间的观点是有限的,因此从诸如Bio3D-web的工具获得的洞察力对于某些蛋白质也是有限的。然而,随着目前的技术进步和结构基因组学的新举措,这里提出的协议将越来越成为了解重要的结构 - 功能关系的重要途径。在分析更远的相关蛋白质时特别重要的关键步骤是ALIGN标签中对齐错误的潜在出现。当序列相似性下降到30%以下时,不可避免地发生对准误差,并且在这种情况下用户必须双重检查并校正序列比对在ALIGN标签中。对齐错误可能导致FIT选项卡中不正确的叠加结构,并掩盖后续PCA的最相关的构象变体。此外,用户应该知道所选PDB结构中缺少的残留物,如在当前实施方案中,PCA只能对其中所有结构具有相应碳原子被解离的蛋白质残基进行。因此,如果选择的PDB对于蛋白质的特定区域具有未解决的残基,则该区域将从PCA中省略。
Bio3D-web目前仅限于单链PDB结构的分析。因此,使用当前的方案不能探索在四级水平发生的功能运动。尽管我们正在开发新的算法来将这种分析纳入Bio3D-web,但目前唯一的选择是通过传统的Bio3D使用。
Bio3D-web是唯一的在线应用程序离子,可以查询和识别结构集,解释其序列模式和结构变异性,并从其结构可塑性的分析和预测中提取机械信息。各种分子可视化工具和在线服务器使研究人员能够探索和分析各种生物分子结构。然而,用于分析大型异质蛋白家族的序列,结构和动力学的现有工具通常需要大量的计算专业知识,并且通常只有具有相关编程技能的用户才能访问。例如,Bio3D包需要R 8,PRODY需要Python和Maven需要Matlab的知识9,10。相反,Bio3D-web不需要编程知识,从而增加了可访问性,并减少了执行高级比较序列,结构和染色的进入障碍动态分析。此外,Bio3D-Web服务还包含了有效分析所需的分子结构的准备,策划,注释和清理。另外,通过我们的服务器实例,可以减轻对能力计算资源进行分析的限制,可以对任何现代Web浏览器启动和控制的许多结构进行大规模分析。
Bio3D-Web的开放性开发正在进行中(请参阅https://bitbucket.org/Grantlab/bio3d)。我们继续添加新的分析功能并改进现有的方法。未来的发展将侧重于增加基于距离矩阵的PCA和扭转PCA,更广泛的序列保守方法,包括系统发育成分,整体结合位点识别以及蛋白质家族动态网络分析的新方法。在这方面,当前的Web应用程序代表了起始点通过在用户定义的实验结构集上实现可重复和可共享的步骤,可以为许多其他协作结构生物信息学分析工作流程。我们还计划从PDB结构的不对称单位除个体和多个链之外重建生物单位坐标集的未来支持。其他功能将包括增强协同工作空间的保存和加载以及撤消可能性。
Bio3D-Web是生物分子结构数据交互式分析的在线应用。 Bio3D-web可在任何现代Web浏览器上运行,并提供以下功能:(1)将相关蛋白质结构集合识别为用户指定的相似阈值; (2)它们的多重对齐和结构叠加; (3)序列和结构守恒分析; (4)构象间关系映射与主成分分析,(5)通过集合比较预测的内部动力学mal模式分析。该综合功能为蛋白质家族和超家族中序列结构 - 动态关系的调查提供了完整的工作流程。除了方便易用的动态界面,用于探索参数和方法选择的影响,Bio3D-web还记录了用户会话的完整用户输入和后续图形结果。这允许用户轻松共享和重现创建其结果的分析步骤序列.Bio3D-Web完全以R语言实现,并基于Bio3D和Shiny R软件包。它可以从我们的在线服务器运行,也可以在任何运行R的计算机上本地运行。这包括本地服务器安装,以提供定制的多用户实例,可访问优先结构数据集,如制药行业常见的数据集。完整的源代码和广泛的文档是根据GPL-3开源许可证提供的:http://thegrantlab.org/ bio3d / webapps中
作者宣称他们没有竞争的经济利益。
感谢Guido Scarabelli和Hongyang Li博士在开发过程中进行广泛的测试,以及Bio3D用户社区和卑尔根大学结构生物信息学研讨会参与者的反馈和意见,从而改进了这一应用。
Name | Company | Catalog Number | Comments |
Bio3D-web | |||
Web-site | http://thegrantlab.org/bio3d-web/ | ||
Requirements | Web browser |
请求许可使用此 JoVE 文章的文本或图形
请求许可This article has been published
Video Coming Soon
版权所属 © 2025 MyJoVE 公司版权所有,本公司不涉及任何医疗业务和医疗服务。