このプロトコールの目標は、植物転写因子WRKYドメインタンパク質を例示的な系として用いて、DNAに沿ったタンパク質の1次元拡散の構造ダイナミクスを明らかにすることである。マルコフ状態モデル構築の下での原子シミュレーションは、DNAに沿ったタンパク質の1-bpステップ運動を原子の詳細で明らかにする。一方、粗粒度のシミュレーションは、DNAに沿って10bpsを超えるタンパク質のプロセス拡散のサンプリングに焦点を当てています。
まず、10 マイクロ秒の全原子 MD 軌道を使用して、10,000 フレーム前方の 1 塩基対ステッピング パスを均等に抽出します。VMD で 10, 000 フレームの遷移パスを準備するには、[ファイル] と [座標の保存] をクリックします。次に、[選択した原子]ボックスにタンパク質または核酸を入力します。
フレームボックスで「フレーム」を選択し、「保存」をクリックして必要なフレームを取得します。DNAの結晶構造から基準の長軸をx軸に揃え、34塩基対DNAの初期質量中心を座標空間の原点に設定するには、[拡張子]をクリックし、[VMDでTkConsole]を選択します。その後、TkConsole コマンド ウィンドウにコマンドを入力します。
次に、VMD をクリックしてタンパク質骨格の二乗平均平方根距離を計算し、[拡張] に移動して [分析] をクリックし、[RMSD 軌道ツール] を選択します。原子選択ボックスに、核酸と残基14~23、および46~55を入力します。[整列] をクリックし、[RMSD] ボックスをクリックします。
DNAθTの周りのタンパク質の回転度を計算するには、初期角度位置決めをθ0として定義し、MATLABのXY平面上でコマンドを実行します。MATLAB に K-means メソッドを使用するための命令を入力し、10, 000 個の構造体を 25 個のクラスターに分類します。完了したら、25のクラスタセンターの構造を収集して、さらにMDシミュレーションを行います。
第1ラウンドのMDシミュレーションを行うには、GROMACSを用いて25の構造物の原子論的システムを構築し、システムshファイルを構築します。NPTアンサンブルの下で25システムの60ナノ秒MDシミュレーションを行い、シェルでコマンドを処理して2フェムト秒の時間ステップを実行します。最初のラウンド MD 軌道をクラスタ化するには、各シミュレーション軌道の最初の 10 ナノ秒を削除し、25 倍の 50 ナノ秒軌道から確認を収集します。
時間に依存しない成分分析では、GROMACSにスクリプトを入力し、続いてタンパク質とDNAの間の距離ペアを入力パラメータ投影として選択します。インデックスから。ndx ファイル、新しいテキスト ファイル インデックスへ.dat。
これらのアトム間のペア情報を取得するには、Python スクリプトを使用します。MSMBuilder コマンド ウィンドウのすべての軌跡から 415 の距離ペアを計算します。次に、時間独立成分分析を実行して、コマンドを実行して、最初の 2 つの時間独立成分またはベクトルにデータの次元を縮小します。
MSMBuilder での命令の処理で、ケース・センター法を使用して、投影されたデータ・セットを 100 個のクラスターにクラスター化し、各クラスターの中心構造を選択します。2回目のMDシミュレーションを行うには、100個の初期構造から60ナノ秒のMDシミュレーションを行います。すべての原子にランダムな初期速度を課した後、MDP ファイルの速度生成をオンにして、ランダムな初期速度を追加します。
前述のように、各シミュレーションの最初の 10 ナノ秒を削除します。そして、100倍の50ナノ秒の軌道から2,500,000のスナップショットを均等に収集して、MSMを構築します。第 2 ラウンドの MD 軌道をクラスタ化するには、図に示すように、MSMBuilder で第 2 ラウンドの軌道の時間独立成分分析を実行します。
また、暗黙のタイムスケールを計算して、Pythonスクリプトを実行してパラメータを検証します。そして、パラメータを変更してラグタイムタウとマイクロステート数を変化させる。コマンドを実行して、確認を 500 個のクラスターに分類します。
MSM 構造では、500 個のマイクロ状態を 3 ~ 6 個のマクロ状態にまとめます。Pythonスクリプトを使用してMSMBuilderのPCCAplusアルゴリズムに従って、最も適したマクロ状態の数を見つける。高次元確認を、各マイクロ状態のDNAに沿ったタンパク質のXおよび回転角度にマッピングする。
平均最初の通過時間を計算するには、モンテカルロの時間ステップとして10ナノ秒のラグタイムを設定した500マイクロ状態MSMの遷移確率行列に基づいて、5つの10ミリ秒のモンテカルロ軌道を実行します。Python スクリプト内のマクロ状態の各ペア間の平均最初の通過時間と、Bash ファイルを使用して平均最初の通過時間の標準誤差の平均を計算します。CafeMol 3.0ソフトウェアでは、端末でコマンドを実行してコースグレインシミュレーションを実行します。
入力ファイルでブロックを指定した後、個々のコマンドでファイル名ブロックとjob_cntlブロックを設定します。次に、unit_and_stateブロックを設定し、続いてenergy_functionブロックとmd_informationブロックを設定します。DNA上のすべてのタンパク質確認は、DNAに沿ったタンパク質の縦方向の動きXおよび回転角度にマッピングされ、これはさらに3つのマクロ状態にクラスタリングされ得る。
S1状態は、水素結合がモデル化された構造に類似しているため、あまり好ましくないが、S3は、1塩基対ステッピング後にすべての水素結合がシフトし、63%の最高集団で安定に見えた準安定状態を指し、中間状態S2は、S1とS3を30%の中高集団で接続し、S2からS3への移行は、約7つの水素結合の集団的切断および改質を可能にするマイクロ秒、一方、S1からS2への移行は約0.06マイクロ秒で起こり得る。タンパク質とDNAの接触数を計算し、4つの状態を同定した。状態1及び状態3では、ジンクフィンガー領域がY方向に向かって結合する。
一方状態2および3では、ジンクフィンガー領域はY方向に向かって結合する。DNAの異なる配列上の保存された各残基のステッピングサイズを測定し、これらの残基のステッピングサイズがpolyATまたはランダムDNA配列よりもpolyA DNA上でより同期していることが明らかになった。マルコフ状態モデル構築における重要なステップは、1-bpのステッピング運動に対するタンパク質とDNAデータの修復の間の距離ペアの選択、および適切な数のミクロ状態とマクロ状態の選択である。