L'obiettivo di questo protocollo è quello di rivelare le dinamiche strutturali della diffusione unidimensionale delle proteine lungo il DNA, utilizzando una proteina di dominio WRKY del fattore di trascrizione vegetale come sistema esemplare. Le simulazioni atomiche sotto la costruzione del modello di stato di Markov rivelano movimenti di passo di 1 bp di proteine lungo il DNA ai dettagli atomici. Mentre le simulazioni a grana grossa si concentrano sul campionamento di diffusioni processative proteiche superiori a 10 bps lungo il DNA.
Per iniziare, utilizzare una traiettoria MD all-atom di 10 microsecondi per estrarre 10.000 fotogrammi uniformemente in avanti, un percorso di passo della coppia di basi. Preparare il percorso di transizione con 10.000 fotogrammi in VMD facendo clic su File e salva coordinate. Quindi, digitare proteina o nucleico nella casella Atomi selezionati.
Scegliete Fotogrammi nella casella fotogrammi e fate clic su Salva per ottenere i fotogrammi necessari. Allineare l'asse lungo del riferimento dalla struttura cristallina del DNA all'asse x e impostare il centro di massa iniziale delle 34 coppie di basi complete DNA all'origine dello spazio delle coordinate facendo clic su Estensioni e quindi selezionando TkConsole in VMD. Successivamente, digitare il comando nella finestra di comando di TkConsole.
Quindi, calcolare la distanza quadrata della radice della spina dorsale della proteina facendo clic su VMD, quindi andare su Estensioni, fare clic su Analisi e selezionare lo strumento traiettoria RMSD. Nella casella di selezione dell'atomo, digitare nucleico e residuo da 14 a 23 e da 46 a 55. Fare clic su ALLINEA e quindi sulla casella RMSD.
Per calcolare il grado rotazionale della proteina attorno al DNA theta T, con il posizionamento angolare iniziale definito come theta 0, sul piano XY in MATLAB, eseguire il comando. Inserisci le istruzioni in MATLAB per utilizzare i metodi K-means e classifica le 10.000 strutture in 25 cluster. Una volta fatto, raccogli le strutture dei 25 centri cluster per un'ulteriore simulazione MD.
Per condurre la simulazione MD del primo round, costruisci un sistema atomistico per le 25 strutture usando GROMACS e il file sh del sistema di compilazione. Esegui simulazioni MD di 60 nanosecondi per i 25 sistemi sotto l'insieme NPT con un passo temporale di due femtosecondi elaborando il comando in shell. Per raggruppare le traiettorie MD del primo round, rimuovere i primi 10 nanosecondi di ciascuna traiettoria di simulazione e raccogliere conferme dalle traiettorie 25 volte 50 nanosecondi.
Per l'analisi dei componenti indipendenti dal tempo, inserire lo script in GROMACS, seguito dalla scelta di coppie di distanza tra proteine e DNA come proiezione dei parametri di input. Dall'indice. ndx, in un nuovo indice di file di testo.dat.
Per ottenere le informazioni sulla coppia tra questi atomi, utilizzare lo script Python. Calcolare le 415 coppie di distanza da ogni traiettoria nella finestra di comando di MSMBuilder. Quindi, eseguire un'analisi dei componenti indipendente dal tempo per ridurre la dimensione dei dati sui primi due componenti o vettori indipendenti dal tempo eseguendo il comando.
Con l'elaborazione dell'istruzione in MSMBuilder, raggruppare i set di dati proiettati in 100 cluster utilizzando il metodo case center e selezionare la struttura centrale di ciascun cluster. Per condurre una simulazione MD di secondo turno, condurre simulazioni MD a 60 nanosecondi a partire dalle 100 strutture iniziali. Dopo aver imposto velocità iniziali casuali su tutti gli atomi, aggiungi le velocità iniziali casuali attivando la generazione di velocità nel file MDP.
Rimuovere i primi 10 nanosecondi di ogni simulazione come descritto in precedenza. E raccogli 2.500.000 istantanee dalle traiettorie di 100 volte 50 nanosecondi, in modo uniforme, per costruire l'MSM. Per raggruppare le traiettorie MD del secondo arrotondamento, eseguire l'analisi dei componenti indipendente dal tempo per le traiettorie del secondo arrotondamento in MSMBuilder, come illustrato.
E calcola la scala temporale implicita per convalidare i parametri eseguendo lo script Python. Quindi, variare il tempo di ritardo tau e il numero di microstati modificando i parametri. Classificare le conferme in 500 cluster eseguendo il comando.
Per la costruzione di MSM, raggruppare i 500 microstati in tre o sei macrostati. Per scoprire il numero di macro-stati che si adattano meglio, secondo l'algoritmo PCCAplus in MSMBuilder utilizzando lo script Python. Mappare le conferme dimensionali elevate all'angolo X e rotazionale della proteina lungo il DNA per ogni microstato.
Per calcolare i tempi medi di primo passaggio, eseguire cinque traiettorie Monte Carlo da 10 millisecondi, basate sulla matrice di probabilità di transizione del MSM a microstato 500 con il tempo di ritardo di 10 nanosecondi impostato come passo temporale di Monte Carlo. Calcola i tempi medi di primo passaggio tra ogni coppia di macro-stati all'interno dello script Python e la media degli errori standard dei tempi medi di primo passaggio usando il file Bash. Nel software CafeMol 3.0, eseguire la simulazione a grana di corso eseguendo il comando sul terminale.
Dopo aver specificato i blocchi nel file di input, impostare il blocco dei nomi dei file e il blocco job_cntl con i singoli comandi. Quindi, imposta il blocco unit_and_state, seguito dall'impostazione del blocco energy_function e del blocco md_information. Tutte le conferme proteiche sul DNA sono state mappate al movimento longitudinale X e all'angolo di rotazione della proteina lungo il DNA, che può essere ulteriormente raggruppato in tre macro-stati.
Lo stato S1 è meno favorevole in quanto i legami idrogeno sono simili alla struttura modellata, mentre S3 si riferisce a uno stato metastabile in cui tutti i legami idrogeno si sono spostati dopo un passo della coppia di basi e sono apparsi stabili con la popolazione più alta del 63%Lo stato intermedio S2 collega S1 e S3 con una popolazione medio alta del 30% La transizione di S2 a S3 consente la rottura collettiva e il reforming dei legami idrogeno in circa sette microsecondi, mentre la transizione da S1 a S2 può avvenire in circa 0,06 microsecondi. Sono stati calcolati i numeri di contatto tra proteine e DNA e sono stati identificati quattro stati. Negli stati 1 e 3, la regione del dito di zinco si lega verso la direzione Y.
Mentre negli stati 2 e 3, la regione del dito di zinco si lega verso la direzione Y. È stata misurata la dimensione del passo per ogni residuo conservato su diverse sequenze di DNA, il che ha rivelato che le dimensioni di passo di questi residui sono più sincronizzate sul DNA polyA che su sequenze di POLYAT o DNA casuali. I passi importanti nella costruzione del modello di stato di Markov sono la scelta di coppie di distanza tra le riparazioni dei dati proteici e del DNA nei movimenti di passo di 1 bp e la selezione di un numero adeguato di micro-stati e macro-stati.