Das Ziel dieses Protokolls ist es, die strukturelle Dynamik der eindimensionalen Diffusion von Protein entlang der DNA unter Verwendung eines pflanzlichen Transkriptionsfaktors WRKY-Domänenprotein als beispielhaftes System aufzudecken. Die atomaren Simulationen unter der Markov-Zustandsmodellkonstruktion zeigen 1-bp-Schrittbewegungen des Proteins entlang der DNA an atomaren Details. Während sich die grobkörnigen Simulationen auf die Probenahme von proteinprozessiven Diffusionen über 10 von bps entlang der DNA konzentrieren.
Verwenden Sie zunächst eine 10-Mikrosekunden-Allatom-MD-Trajektorie, um 10.000 Frames gleichmäßig nach vorne zu extrahieren, ein Basispaar-Schrittpfad. Bereiten Sie den Übergangspfad mit 10.000 Frames in VMD vor, indem Sie auf Datei und Koordinaten speichern klicken. Geben Sie dann Protein oder Nukleinsäure in das Feld Ausgewählte Atome ein.
Wählen Sie im Feld Frames die Option Frames aus, und klicken Sie auf Speichern, um die benötigten Frames abzurufen. Richten Sie die Längsachse der Referenz von der Kristallstruktur der DNA auf die x-Achse aus und legen Sie den Anfangsschwerpunkt der vollen 34 Basenpaare DNA am Ursprung des Koordinatenraums fest, indem Sie auf Erweiterungen klicken und dann TkConsole in VMD auswählen. Geben Sie anschließend den Befehl in das TkConsole-Befehlsfenster ein.
Berechnen Sie dann den quadratischen Abstand des Proteinrückgrats, indem Sie auf VMD klicken, dann zu Erweiterungen wechseln, auf Analyse klicken und das RMSD-Trajektorienwerkzeug auswählen. Geben Sie im Feld für die Atomauswahl Nukleinsäure und Rest 14 bis 23 und 46 bis 55 ein. Klicken Sie auf AUSRICHTEN und dann auf das Feld RMSD.
Um den Rotationsgrad des Proteins um DNA Theta T zu berechnen, wobei die anfängliche Winkelpositionierung als Theta 0 definiert ist, führen Sie den Befehl auf der XY-Ebene in MATLAB aus. Geben Sie die Anweisungen in MATLAB ein, um K-Means-Methoden zu verwenden, und klassifizieren Sie die 10.000 Strukturen in 25 Cluster. Wenn Sie fertig sind, sammeln Sie die Strukturen der 25 Clusterzentren für die weitere MD-Simulation.
Um die MD-Simulation der ersten Runde durchzuführen, erstellen Sie ein atomistisches System für die 25 Strukturen mit GROMACS und der Build-System-SH-Datei. Führen Sie 60 Nanosekunden MD-Simulationen für die 25 Systeme unter NPT-Ensemble mit einem Zeitschritt von zwei Femtosekunden durch, indem Sie den Befehl in der Schale verarbeiten. Um die MD-Trajektorien der ersten Runde zu clustern, entfernen Sie die ersten 10 Nanosekunden jeder Simulationstrajektorie und sammeln Sie Bestätigungen von den 25-mal-50-Nanosekunden-Trajektorien.
Für die zeitunabhängige Komponentenanalyse geben Sie das Skript in GROMACS ein, gefolgt von der Auswahl von Abstandspaaren zwischen Protein und DNA als Eingabeparameterprojektion. Aus dem Index. NDX-Datei, in einen neuen Textdateiindex.dat.
Um die Paarinformationen zwischen diesen Atomen abzurufen, verwenden Sie das Python-Skript. Berechnen Sie die 415 Entfernungspaare aus jeder Trajektorie im MSMBuilder-Befehlsfenster. Führen Sie als Nächstes eine zeitunabhängige Komponentenanalyse durch, um die Dimension der Daten auf die ersten beiden zeitunabhängigen Komponenten oder Vektoren zu reduzieren, indem Sie den Befehl ausführen.
Bei der Verarbeitung der Anweisung in MSMBuilder gruppieren Sie die projizierten Datensätze mithilfe der Case-Center-Methode in 100 Cluster, und wählen Sie die Centerstruktur jedes Clusters aus. Um eine MD-Simulation der zweiten Runde durchzuführen, führen Sie 60-Nanosekunden-MD-Simulationen durch, beginnend mit den 100 Anfangsstrukturen. Nachdem Sie allen Atomen zufällige Anfangsgeschwindigkeiten auferlegt haben, fügen Sie die zufälligen Anfangsgeschwindigkeiten hinzu, indem Sie die Geschwindigkeitsgenerierung in der MDP-Datei aktivieren.
Entfernen Sie die ersten 10 Nanosekunden jeder Simulation wie zuvor beschrieben. Und sammeln Sie 2.500.000 Schnappschüsse von den 100 mal 50 Nanosekunden-Trajektorien, gleichmäßig, um das MSM zu konstruieren. Um MD-Trajektorien der zweiten Runde zu clustern, führen Sie die zeitunabhängige Komponentenanalyse für die Trajektorien der zweiten Runde im MSMBuilder wie gezeigt durch.
Und berechnen Sie die implizierte Zeitskala, um Parameter zu validieren, indem Sie das Python-Skript ausführen. Variieren Sie dann die Verzögerungszeit tau und die Anzahl der Mikrozustände, indem Sie die Parameter ändern. Klassifizieren Sie die Bestätigungen in 500 Cluster, indem Sie den Befehl ausführen.
Für die MSM-Konstruktion fassen Sie die 500 Mikrozustände in drei bis sechs Makrozustände zusammen. Um die Anzahl der Makrozustände herauszufinden, die am besten passen, gemäß dem PCCAplus-Algorithmus in MSMBuilder mithilfe des Python-Skripts. Bilden Sie die hochdimensionalen Bestätigungen auf das X und den Rotationswinkel des Proteins entlang der DNA für jeden Mikrozustand ab.
Um die mittleren ersten Durchgangszeiten zu berechnen, führen Sie fünf 10-Millisekunden-Monte-Carlo-Trajektorien durch, die auf der Übergangswahrscheinlichkeitsmatrix des 500-Mikrozustands-MSM basieren, wobei die Verzögerungszeit von 10 Nanosekunden als Zeitschritt von Monte Carlo festgelegt ist. Berechnen Sie die mittleren ersten Durchgangszeiten zwischen jedem Makrozustandspaar innerhalb des Python-Skripts und den Durchschnitt des Standardfehlers der mittleren ersten Passagezeiten mithilfe der Bash-Datei. Führen Sie in der CafeMol 3.0-Software die kursgestaffelte Simulation aus, indem Sie den Befehl auf dem Terminal ausführen.
Nachdem Sie die Blöcke in der Eingabedatei angegeben haben, legen Sie den Dateinamenblock und den job_cntl Block mit den einzelnen Befehlen fest. Legen Sie als Nächstes den unit_and_state Block fest, gefolgt vom Festlegen des energy_function Blocks und des md_information-Blocks. Alle Proteinbestätigungen auf der DNA wurden der Längsbewegung X und dem Rotationswinkel des Proteins entlang der DNA zugeordnet, die weiter in drei Makrozustände geclustert werden können.
Der S1-Zustand ist weniger günstig, da die Wasserstoffbrückenbindungen der modellierten Struktur ähneln, während sich S3 auf einen metastabilen Zustand bezieht, in dem sich alle Wasserstoffbrückenbindungen nach einem Basenpaar-Stepping verschoben haben und mit der höchsten Population von 63% stabil erschienen. Der Zwischenzustand S2 verbindet S1 und S3 mit einer mittelhohen Population von 30%Der Übergang von S2 zu S3 ermöglicht das kollektive Aufbrechen und Reformieren der Wasserstoffbrückenbindungen in etwa sieben Mikrosekunden, während der Übergang von S1 zu S2 in etwa 0,06 Mikrosekunden erfolgen kann. Die Kontaktnummern zwischen Protein und DNA wurden berechnet und vier Zustände identifiziert. In den Zuständen 1 und 3 bindet die Zinkfingerregion in Richtung Y.
Während in den Zuständen 2 und 3 die Zinkfingerregion in Richtung Y bindet. Die Schrittgröße für jeden konservierten Rest auf verschiedenen DNA-Sequenzen wurde gemessen, was zeigte, dass die Schrittgrößen dieser Rückstände auf polyA-DNA stärker synchronisiert sind als auf polyAT- oder zufälligen DNA-Sequenzen. Die wichtigen Schritte in der Markov-Zustandsmodellkonstruktion sind die Auswahl von Entfernungspaaren zwischen Protein- und DNA-Datenreparaturen in die 1-bp-Schrittbewegungen und die Auswahl einer geeigneten Anzahl von Mikrozuständen und Makrozuständen.