L’objectif de ce protocole est de révéler la dynamique structurelle de la diffusion unidimensionnelle des protéines le long de l’ADN, en utilisant une protéine du domaine WRKY du facteur de transcription végétale comme système exemplaire. Les simulations atomiques sous la construction du modèle d’état de Markov révèlent des mouvements de pas de 1 bp de protéines le long de l’ADN aux détails atomiques. Alors que les simulations à grains grossiers se concentrent sur l’échantillonnage de diffusions processives protéiques sur 10 de bps le long de l’ADN.
Pour commencer, utilisez une trajectoire MD de 10 microsecondes entièrement atomique pour extraire 10 000 images uniformément vers l’avant, un chemin de pas de paire de bases. Préparez le chemin de transition avec 10 000 images dans VMD en cliquant sur Fichier et Enregistrer les coordonnées. Ensuite, tapez protéine ou nucléique dans la zone Atomes sélectionnés.
Choisissez Images dans la zone Images, puis cliquez sur Enregistrer pour obtenir les images nécessaires. Alignez l’axe long de la référence de la structure cristalline de l’ADN sur l’axe des x et définissez le centre de masse initial des 34 paires de bases complètes d’ADN à l’origine de l’espace de coordonnées en cliquant sur Extensions, puis en sélectionnant TkConsole dans VMD. Ensuite, tapez la commande dans la fenêtre de commande TkConsole.
Ensuite, calculez la racine signifie la distance carrée de l’épine dorsale de la protéine en cliquant sur VMD, puis accédez à Extensions, cliquez sur Analyse et sélectionnez l’outil Trajectoire RMSD. Dans la zone de sélection des atomes, tapez nucléique et résidu 14 à 23 et 46 à 55. Cliquez sur ALIGNER, puis sur la zone RMSD.
Pour calculer le degré de rotation de la protéine autour de l’ADN thêta T, avec le positionnement angulaire initial défini comme thêta 0, sur le plan XY dans MATLAB, exécutez la commande. Entrez les instructions dans MATLAB pour utiliser les méthodes K-means et classez les 10 000 structures en 25 clusters. Une fois cela fait, rassemblez les structures des 25 centres de cluster pour une simulation MD plus poussée.
Pour effectuer la simulation MD de premier tour, construisez un système atomistique pour les 25 structures à l’aide de GROMACS et du fichier sh du système de construction. Effectuez des simulations MD de 60 nanosecondes pour les 25 systèmes sous ensemble NPT avec un pas de temps de deux femtosecondes en traitant la commande dans le shell. Pour regrouper les trajectoires MD du premier tour, retirez les 10 premières nanosecondes de chaque trajectoire de simulation et collectez les confirmations des trajectoires 25 fois 50 nanosecondes.
Pour l’analyse des composants indépendante du temps, entrez le script dans GROMACS, puis choisissez des paires de distance entre la protéine et l’ADN comme projection des paramètres d’entrée. À partir de l’index. ndx, vers un nouvel index de fichier texte.dat.
Pour obtenir les informations de paire entre ces atomes, utilisez le script Python. Calculez les 415 paires de distance de chaque trajectoire dans la fenêtre de commande MSMBuilder. Ensuite, effectuez une analyse de composant indépendante du temps pour réduire la dimension des données sur les deux premiers composants ou vecteurs indépendants du temps en exécutant la commande.
Avec le traitement de l’instruction dans MSMBuilder, regroupez les ensembles de données projetés en 100 clusters à l’aide de la méthode case center et sélectionnez la structure centrale de chaque cluster. Pour effectuer une simulation MD de deuxième tour, effectuez des simulations MD de 60 nanosecondes à partir des 100 structures initiales. Après avoir imposé des vitesses initiales aléatoires sur tous les atomes, ajoutez les vitesses initiales aléatoires en activant la génération Velocity dans le fichier MDP.
Supprimez les 10 premières nanosecondes de chaque simulation comme décrit précédemment. Et collectez 2 500 000 instantanés à partir des trajectoires de 100 fois 50 nanosecondes, uniformément, pour construire le MSM. Pour regrouper les trajectoires MD du deuxième tour, effectuez l’analyse des composants indépendante du temps pour les trajectoires du deuxième tour dans MSMBuilder comme indiqué.
Et calculez l’échelle de temps implicite pour valider les paramètres en exécutant le script Python. Ensuite, faites varier le temps de latence tau et le nombre de micro-états en modifiant les paramètres. Classez les confirmations en 500 clusters en exécutant la commande.
Pour la construction MSM, regroupez les 500 micro-états en trois à six macro-états. Pour connaître le nombre de macro-états qui conviennent le mieux, selon l’algorithme PCCAplus dans MSMBuilder en utilisant le script Python. Mappez les confirmations de haute dimension au X et à l’angle de rotation de la protéine le long de l’ADN pour chaque micro-état.
Pour calculer les temps moyens de premier passage, effectuez cinq trajectoires de Monte-Carlo de 10 millisecondes, basées sur la matrice de probabilité de transition du MSM à 500 micro-états avec le temps de latence de 10 nanosecondes défini comme pas de temps de Monte-Carlo. Calculez les temps moyens de premier passage entre chaque paire de macro-états dans le script Python et la moyenne d’erreur standard des temps moyens de premier passage à l’aide du fichier Bash. Dans le logiciel CafeMol 3.0, exécutez la simulation détaillée en exécutant la commande sur le terminal.
Après avoir spécifié les blocs dans le fichier d’entrée, définissez le bloc des noms de fichiers et le bloc job_cntl avec les commandes individuelles. Ensuite, définissez le bloc unit_and_state, puis définissez le bloc energy_function et le bloc md_information. Toutes les confirmations de protéines sur l’ADN ont été mappées au mouvement longitudinal X et à l’angle de rotation de la protéine le long de l’ADN, qui peut être regroupé en trois macro-états.
L’état S1 est moins favorable car les liaisons hydrogène sont similaires à la structure modélisée, tandis que S3 se réfère à un état métastable où toutes les liaisons hydrogène se sont déplacées après un pas de paire de bases et sont apparues stables avec la population la plus élevée de 63%L’état intermédiaire S2 relie S1 et S3 avec une population moyennement élevée de 30%La transition de S2 à S3 permet la rupture et le reformage collectifs des liaisons hydrogène dans environ sept microsecondes, tandis que la transition S1 à S2 peut se produire en environ 0,06 microseconde. Les numéros de contact entre la protéine et l’ADN ont été calculés et quatre états ont été identifiés. Dans les états 1 et 3, la région du doigt de zinc se lie vers la direction Y.
Alors que dans les états 2 et 3, la région du doigt de zinc se lie vers la direction Y. La taille de pas pour chaque résidu conservé sur différentes séquences d’ADN a été mesurée, ce qui a révélé que les tailles de pas de ces résidus sont plus synchronisées sur l’ADN polyA que sur les séquences d’ADN polyAT ou aléatoires. Les étapes importantes de la construction du modèle d’état de Markov sont le choix de paires de distances entre les réparations des données protéiques et ADN dans les mouvements de pas de 1 pb, et la sélection d’un nombre approprié de micro-états et de macro-états.