该协议的目标是揭示蛋白质沿DNA的一维扩散的结构动力学,使用植物转录因子WRKY结构域蛋白作为示例系统。马尔可夫状态模型构建下的原子模拟揭示了蛋白质在原子细节下沿DNA的1-bp步进运动。而粗粒度模拟侧重于沿DNA的蛋白质过程扩散超过10个bps的采样。
首先,使用10微秒的全原子MD轨迹来平均向前提取10, 000帧,一个基本对步进路径。通过单击文件和保存坐标,在 VMD 中准备具有 10, 000 帧的过渡路径。然后,在“选定的原子”框中键入蛋白质或细胞核。
在“框架”框中选择“框架”,然后单击“保存”以获取所需的框架。将参考的长轴从DNA的晶体结构对齐到x轴,并通过单击扩展,然后在VMD中选择TkConsole,将完整的34个碱基对DNA的初始质心设置为坐标空间的原点。然后,在 TkConsole 命令窗口中键入该命令。
然后,通过单击 VMD 计算蛋白质主链的均根平方距离,然后转到扩展,单击分析,然后选择 RMSD 轨迹工具。在原子选择框中,键入原子核和残基14至23和46至55。单击“对齐”,然后单击“RMSD”框。
要计算蛋白质围绕DNAθ T的旋转度,在MATLAB的XY平面上,使用定义为θ 0的初始角度定位,执行命令。在 MATLAB 中输入指令以使用 K 均值方法,并将 10, 000 个结构分类为 25 个聚类。完成后,收集25个集群中心的结构以进行进一步的MD模拟。
要进行第一轮 MD 仿真,请使用 GROMACS 和构建系统 sh 文件为 25 个结构构建一个原子系统。通过在壳中处理命令,对 NPT 集成下的 25 个系统进行 60 纳秒的 MD 仿真,时间步长为 2 飞秒。要对第一轮 MD 轨迹进行聚类,请删除每个仿真轨迹的前 10 纳秒,并从 25 乘以 50 纳秒的轨迹收集确认。
对于与时间无关的成分分析,请在GROMACS中输入脚本,然后选择蛋白质和DNA之间的距离对作为输入参数投影。从索引。ndx 文件,到新的文本文件索引.dat。
要获取这些原子之间的对信息,请使用 Python 脚本。在 MSMBuilder 命令窗口中计算每个轨迹的 415 个距离对。接下来,执行与时间无关的分量分析,通过执行命令将数据维度减少到前两个时间独立分量或向量上。
通过处理 MSMBuilder 中的指令,使用案例中心方法将投影数据集聚类为 100 个聚类,并选择每个聚类的中心结构。要进行第二轮MD仿真,请从100个初始结构开始进行60纳秒的MD仿真。对所有原子施加随机初始速度后,通过打开 MDP 文件中的速度生成来添加随机初始速度。
如前所述,删除每个模拟的前 10 纳秒。并从 100 乘以 50 纳秒的轨迹中均匀地收集 2, 500,000 个快照,以构建 MSM。要对第二轮 MD 轨迹进行聚类,请在 MSMBuilder 中对第二轮轨迹执行与时间无关的分量分析,如下所示。
并通过执行Python脚本计算隐含的时间尺度以验证参数。然后,通过改变参数来改变滞后时间tau和微态数。通过执行命令将确认分类为 500 个群集。
对于 MSM 构造,将 500 个微状态集中为三到六个宏状态。若要找出最适合的宏状态的数量,请根据 MSMBuilder 中的 PCCAplus 算法,使用 Python 脚本。将高维确认映射到蛋白质沿每个微观状态的DNA的X和旋转角度。
为了计算平均首次通过时间,基于500微态MSM的转移概率矩阵进行5个10毫秒的蒙特卡罗轨迹,滞后时间为10纳秒作为蒙特卡罗的时间步长。使用 Bash 文件计算 Python 脚本中每对宏状态之间的平均首次通过时间,以及平均首次通过时间的标准误差平均值。在CafeMol 3.0软件中,通过在终端上执行命令来运行课程粒度模拟。
在输入文件中指定块后,使用各个命令设置文件名块和job_cntl块。接下来,设置unit_and_state块,然后设置energy_function块和md_information块。DNA上的所有蛋白质确认都映射到蛋白质沿DNA的纵向运动X和旋转角度,这可以进一步聚类为三种宏观状态。
S1状态不太有利,因为氢键与建模结构相似,而S3指的是亚稳态,其中所有氢键在一个碱基对步进后移动并且看起来稳定,最高总体为63%中间状态S2连接S1和S3,中等高群体为30%S2到S3的转换允许在大约七个中集体破坏和重整氢键微秒,而 S1 到 S2 的转换可以在大约 0.06 微秒内发生。计算蛋白质和DNA之间的接触次数,并确定四种状态。在状态 1 和 3 中,锌指区域向 Y 方向结合。
而在状态2和3中,锌指区域向Y方向结合。测量了不同DNA序列上每个保守残基的步进尺寸,结果表明,这些残基的步进尺寸在polyA DNA上比在polyAT或随机DNA序列上更同步。马尔可夫状态模型构建的重要步骤是选择蛋白质和DNA数据之间的距离对,修复成1-bp步进运动,并选择合适数量的微观状态和宏观状态。