S'identifier

Simulation et échantillonnage basés sur la structure des mouvements des protéines du facteur de transcription le long de l’ADN, du passage à l’échelle atomique à la diffusion à grain grossier

Please note that all translations are automatically generated. Click here for the English version.

3.1K Views

•

09:17 min

•

March 1st, 2022

DOI :

10.3791/63406-v

March 1st, 2022

•

Chao E*¹, Liqiang Dai*¹^,², Jiaqi Tian³^,⁴, Lin-Tai Da⁴, Jin Yu⁵^,⁶^,⁷

¹Beijing Computational Science Research Center, ²Shenzhen JL Computational Science and Applied Research Institute, ³School of Medical Informatics and Engineering, Xuzhou Medical University, ⁴Key Laboratory of Systems Biomedicine (Ministry of Education), Shanghai Center for Systems Biomedicine, Shanghai Jiao Tong University, ⁵Department of Physics and Astronomy, University of California, Irvine, ⁶Department of Chemistry, University of California, Irvine, ⁷NSF-Simons Center for Multiscale Cell Fate Research, University of California, Irvine

Transcription

L’objectif de ce protocole est de révéler la dynamique structurelle de la diffusion unidimensionnelle des protéines le long de l’ADN, en utilisant une protéine du domaine WRKY du facteur de transcription végétale comme système exemplaire. Les simulations atomiques sous la construction du modèle d’état de Markov révèlent des mouvements de pas de 1 bp de protéines le long de l’ADN aux détails atomiques. Alors que les simulations à grains grossiers se concentrent sur l’échantillonnage de diffusions processives protéiques sur 10 de bps le long de l’ADN.

Pour commencer, utilisez une trajectoire MD de 10 microsecondes entièrement atomique pour extraire 10 000 images uniformément vers l’avant, un chemin de pas de paire de bases. Préparez le chemin de transition avec 10 000 images dans VMD en cliquant sur Fichier et Enregistrer les coordonnées. Ensuite, tapez protéine ou nucléique dans la zone Atomes sélectionnés.

Choisissez Images dans la zone Images, puis cliquez sur Enregistrer pour obtenir les images nécessaires. Alignez l’axe long de la référence de la structure cristalline de l’ADN sur l’axe des x et définissez le centre de masse initial des 34 paires de bases complètes d’ADN à l’origine de l’espace de coordonnées en cliquant sur Extensions, puis en sélectionnant TkConsole dans VMD. Ensuite, tapez la commande dans la fenêtre de commande TkConsole.

Ensuite, calculez la racine signifie la distance carrée de l’épine dorsale de la protéine en cliquant sur VMD, puis accédez à Extensions, cliquez sur Analyse et sélectionnez l’outil Trajectoire RMSD. Dans la zone de sélection des atomes, tapez nucléique et résidu 14 à 23 et 46 à 55. Cliquez sur ALIGNER, puis sur la zone RMSD.

Pour calculer le degré de rotation de la protéine autour de l’ADN thêta T, avec le positionnement angulaire initial défini comme thêta 0, sur le plan XY dans MATLAB, exécutez la commande. Entrez les instructions dans MATLAB pour utiliser les méthodes K-means et classez les 10 000 structures en 25 clusters. Une fois cela fait, rassemblez les structures des 25 centres de cluster pour une simulation MD plus poussée.

Pour effectuer la simulation MD de premier tour, construisez un système atomistique pour les 25 structures à l’aide de GROMACS et du fichier sh du système de construction. Effectuez des simulations MD de 60 nanosecondes pour les 25 systèmes sous ensemble NPT avec un pas de temps de deux femtosecondes en traitant la commande dans le shell. Pour regrouper les trajectoires MD du premier tour, retirez les 10 premières nanosecondes de chaque trajectoire de simulation et collectez les confirmations des trajectoires 25 fois 50 nanosecondes.

Pour l’analyse des composants indépendante du temps, entrez le script dans GROMACS, puis choisissez des paires de distance entre la protéine et l’ADN comme projection des paramètres d’entrée. À partir de l’index. ndx, vers un nouvel index de fichier texte.dat.

Pour obtenir les informations de paire entre ces atomes, utilisez le script Python. Calculez les 415 paires de distance de chaque trajectoire dans la fenêtre de commande MSMBuilder. Ensuite, effectuez une analyse de composant indépendante du temps pour réduire la dimension des données sur les deux premiers composants ou vecteurs indépendants du temps en exécutant la commande.

Avec le traitement de l’instruction dans MSMBuilder, regroupez les ensembles de données projetés en 100 clusters à l’aide de la méthode case center et sélectionnez la structure centrale de chaque cluster. Pour effectuer une simulation MD de deuxième tour, effectuez des simulations MD de 60 nanosecondes à partir des 100 structures initiales. Après avoir imposé des vitesses initiales aléatoires sur tous les atomes, ajoutez les vitesses initiales aléatoires en activant la génération Velocity dans le fichier MDP.

Supprimez les 10 premières nanosecondes de chaque simulation comme décrit précédemment. Et collectez 2 500 000 instantanés à partir des trajectoires de 100 fois 50 nanosecondes, uniformément, pour construire le MSM. Pour regrouper les trajectoires MD du deuxième tour, effectuez l’analyse des composants indépendante du temps pour les trajectoires du deuxième tour dans MSMBuilder comme indiqué.

Et calculez l’échelle de temps implicite pour valider les paramètres en exécutant le script Python. Ensuite, faites varier le temps de latence tau et le nombre de micro-états en modifiant les paramètres. Classez les confirmations en 500 clusters en exécutant la commande.

Pour la construction MSM, regroupez les 500 micro-états en trois à six macro-états. Pour connaître le nombre de macro-états qui conviennent le mieux, selon l’algorithme PCCAplus dans MSMBuilder en utilisant le script Python. Mappez les confirmations de haute dimension au X et à l’angle de rotation de la protéine le long de l’ADN pour chaque micro-état.

Pour calculer les temps moyens de premier passage, effectuez cinq trajectoires de Monte-Carlo de 10 millisecondes, basées sur la matrice de probabilité de transition du MSM à 500 micro-états avec le temps de latence de 10 nanosecondes défini comme pas de temps de Monte-Carlo. Calculez les temps moyens de premier passage entre chaque paire de macro-états dans le script Python et la moyenne d’erreur standard des temps moyens de premier passage à l’aide du fichier Bash. Dans le logiciel CafeMol 3.0, exécutez la simulation détaillée en exécutant la commande sur le terminal.

Après avoir spécifié les blocs dans le fichier d’entrée, définissez le bloc des noms de fichiers et le bloc job_cntl avec les commandes individuelles. Ensuite, définissez le bloc unit_and_state, puis définissez le bloc energy_function et le bloc md_information. Toutes les confirmations de protéines sur l’ADN ont été mappées au mouvement longitudinal X et à l’angle de rotation de la protéine le long de l’ADN, qui peut être regroupé en trois macro-états.

L’état S1 est moins favorable car les liaisons hydrogène sont similaires à la structure modélisée, tandis que S3 se réfère à un état métastable où toutes les liaisons hydrogène se sont déplacées après un pas de paire de bases et sont apparues stables avec la population la plus élevée de 63%L’état intermédiaire S2 relie S1 et S3 avec une population moyennement élevée de 30%La transition de S2 à S3 permet la rupture et le reformage collectifs des liaisons hydrogène dans environ sept microsecondes, tandis que la transition S1 à S2 peut se produire en environ 0,06 microseconde. Les numéros de contact entre la protéine et l’ADN ont été calculés et quatre états ont été identifiés. Dans les états 1 et 3, la région du doigt de zinc se lie vers la direction Y.

Alors que dans les états 2 et 3, la région du doigt de zinc se lie vers la direction Y. La taille de pas pour chaque résidu conservé sur différentes séquences d’ADN a été mesurée, ce qui a révélé que les tailles de pas de ces résidus sont plus synchronisées sur l’ADN polyA que sur les séquences d’ADN polyAT ou aléatoires. Les étapes importantes de la construction du modèle d’état de Markov sont le choix de paires de distances entre les réparations des données protéiques et ADN dans les mouvements de pas de 1 pb, et la sélection d’un nombre approprié de micro-états et de macro-états.

Résumé

Explorer plus de vidéos

Chapitres dans cette vidéo

0:04

Introduction

0:45

Construction of the Markov State Model from Atomic Molecular Dynamics Simulations

6:26

Conducting Coarse-Grained Simulation to Sample Long-Time Dynamics

6:57

Results: Structure-Based Simulation and Sampling of Transcription Factor Protein Movements

8:45

Conclusion

Vidéos Associées

article

Une seule molécule Simple, robuste et haut débit débit étirement test mise en place pour étudier le Transport de molécules le long de l’ADN

8.1K Views

article

Analyse en temps réel du facteur de Transcription Binding, Transcription, traduction et chiffre d’affaires pour afficher des événements mondiaux au cours de l’Activation cellulaire

13.5K Views

article

Haute sensibilité mesure des affinités de liaison de l’ADN-facteur de Transcription par titrage concurrentiel à l’aide de la microscopie en Fluorescence

8.7K Views

article

Visualiser les interactions protéine-ADN dans des cellules bactériennes vivantes en utilisant photoactivés suivi unique molécule

17.8K Views

article

Pinces optiques pour étudier les interactions ARN-protéine dans la régulation de la traduction

4.9K Views

article

Imagerie à molécule unique de condensats EWS-FLI1 assemblés sur de l’ADN

2.4K Views

article

Pinces magnétiques à grande vitesse pour les mesures nanomécaniques sur des éléments sensibles à la force

2.0K Views

article

La combinaison unique molécule manipulation et d'imagerie pour l'étude des interactions protéine-ADN

11.5K Views

article

Mesure à molécule unique de la dynamique d’interaction des protéines dans les condensats biomoléculaires

3.4K Views

article

Mesure à molécule unique de la dynamique d’interaction des protéines dans les condensats biomoléculaires

3.4K Views

Copyright © 2025 MyJoVE Corporation. Tous droits réservés.