El objetivo de este protocolo es revelar la dinámica estructural de la difusión unidimensional de la proteína a lo largo del ADN, utilizando una proteína de dominio WRKY del factor de transcripción vegetal como un sistema ejemplar. Las simulaciones atómicas bajo la construcción del modelo de estado de Markov revelan movimientos escalonados de 1 pb de la proteína a lo largo del ADN en los detalles atómicos. Mientras que las simulaciones de grano grueso se centran en el muestreo de difusiones procesivas de proteínas de más de 10 pb a lo largo del ADN.
Para comenzar, use una trayectoria MD de 10 microsegundos para extraer 10, 000 fotogramas uniformemente hacia adelante, una ruta de paso de par de bases. Prepare la ruta de transición con 10.000 fotogramas en VMD haciendo clic en Archivo y Guardar coordenadas. A continuación, escriba proteína o nucleico en el cuadro Átomos seleccionados.
Elija Marcos en el cuadro Marcos y haga clic en Guardar para obtener los fotogramas necesarios. Alinee el eje largo de la referencia desde la estructura cristalina del ADN hasta el eje x, y establezca el centro de masa inicial de los 34 pares de bases completos de ADN en el origen del espacio de coordenadas haciendo clic en Extensiones y luego seleccionando TkConsole en VMD. Después, escriba el comando en la ventana de comandos TkConsole.
Luego, calcule la distancia cuadrada de la raíz significa la columna vertebral de la proteína haciendo clic en VMD, luego vaya a Extensiones, haga clic en Análisis y seleccione la Herramienta de trayectoria RMSD. En el cuadro de selección de átomos, tipo nucleico y residuo 14 a 23, y 46 a 55. Haga clic en ALINEAR y, a continuación, en rmSD.
Para calcular el grado de rotación de la proteína alrededor del ADN theta T, con el posicionamiento angular inicial definido como theta 0, en el plano XY en MATLAB, ejecute el comando. Introduzca las instrucciones de MATLAB para utilizar métodos K-means y clasifique las 10.000 estructuras en 25 clústeres. Una vez hecho esto, reúna las estructuras de los 25 centros de clúster para una mayor simulación de MD.
Para llevar a cabo la primera ronda de simulación MD, construya un sistema atomístico para las 25 estructuras utilizando GROMACS y el archivo sh del sistema de compilación. Realizar simulaciones MD de 60 nanosegundos para los 25 sistemas bajo conjunto NPT con un paso de tiempo de dos femtosegundos procesando el comando en shell. Para agrupar las trayectorias de MD de la primera ronda, elimine los primeros 10 nanosegundos de cada trayectoria de simulación y recopile confirmaciones de las trayectorias de 25 por 50 nanosegundos.
Para el análisis de componentes independiente del tiempo, ingrese el script en GROMACS, seguido de elegir pares de distancia entre proteína y ADN como proyección de parámetros de entrada. Del índice. ndx, a un nuevo índice de archivo de texto.dat.
Para obtener la información del par entre estos átomos, use el script de Python. Calcule los 415 pares de distancia de cada trayectoria en la ventana de comandos de MSMBuilder. A continuación, realice un análisis de componentes independiente del tiempo para reducir la dimensión de los datos en los dos primeros componentes o vectores independientes del tiempo ejecutando el comando.
Con el procesamiento de la instrucción en MSMBuilder, agrupe los conjuntos de datos proyectados en 100 clústeres mediante el método case center y seleccione la estructura central de cada clúster. Para llevar a cabo la simulación de MD de segunda ronda, realice simulaciones de MD de 60 nanosegundos a partir de las 100 estructuras iniciales. Después de imponer velocidades iniciales aleatorias en todos los átomos, agregue las velocidades iniciales aleatorias activando la generación de velocidad en el archivo MDP.
Elimine los primeros 10 nanosegundos de cada simulación como se describió anteriormente. Y recopile 2, 500, 000 instantáneas de las trayectorias de 100 por 50 nanosegundos, de manera uniforme, para construir el MSM. Para agrupar trayectorias de MD de segunda ronda, realice el análisis de componentes independiente del tiempo para las trayectorias de segunda ronda en MSMBuilder como se muestra.
Y calcule la escala de tiempo implícita para validar los parámetros ejecutando el script de Python. Luego, varíe el tiempo de retraso tau y el número de microestados cambiando los parámetros. Clasifique las confirmaciones en 500 clústeres ejecutando el comando.
Para la construcción de HSH, agrupe los 500 microestados en tres a seis macroestados. Para averiguar el número de macroestados que mejor se adaptan, de acuerdo con el algoritmo PCCAplus en MSMBuilder mediante el script de Python. Mapee las confirmaciones de alta dimensión al ángulo X y rotacional de la proteína a lo largo del ADN para cada microestado.
Para calcular los tiempos medios de primer paso, realice cinco trayectorias de Monte Carlo de 10 milisegundos, basadas en la matriz de probabilidad de transición del MSM de 500 microestados con el tiempo de retraso de 10 nanosegundos establecido como el paso de tiempo de Monte Carlo. Calcule los tiempos medios del primer paso entre cada par de macroestados dentro del script de Python y el promedio de error estándar de los tiempos medios del primer pasaje utilizando el archivo Bash. En el software CafeMol 3.0, ejecute la simulación detallada del curso ejecutando el comando en el terminal.
Después de especificar los bloques en el archivo de entrada, establezca el bloque de nombres de archivo y el bloque de job_cntl con los comandos individuales. A continuación, establezca el bloque unit_and_state, seguido de establecer el bloque energy_function y el bloque md_information. Todas las confirmaciones de proteínas en el ADN se mapearon al movimiento longitudinal X y al ángulo de rotación de la proteína a lo largo del ADN, que se puede agrupar en tres macroestados.
El estado S1 es menos favorable ya que los enlaces de hidrógeno son similares a la estructura modelada, mientras que S3 se refiere a un estado metaestable donde todos los enlaces de hidrógeno se desplazaron después de un paso de par de bases y parecían estables con la población más alta del 63%El estado intermedio S2 conecta S1 y S3 con una población media alta del 30%La transición de S2 a S3 permite la ruptura colectiva y el reformado de los enlaces de hidrógeno en aproximadamente siete microsegundos, mientras que la transición de S1 a S2 puede ocurrir en aproximadamente 0,06 microsegundos. Se calcularon los números de contacto entre la proteína y el ADN y se identificaron cuatro estados. En los estados 1 y 3, la región del dedo de zinc se une hacia la dirección Y.
Mientras que en los estados 2 y 3, la región del dedo de zinc se une hacia la dirección Y. Se midió el tamaño de paso para cada residuo conservado en diferentes secuencias de ADN, lo que reveló que los tamaños de paso de estos residuos están más sincronizados en el ADN poliA que en el poliAT o secuencias de ADN aleatorias. Los pasos importantes en la construcción del modelo de estado de Markov son la elección de pares de distancia entre las reparaciones de datos de proteínas y ADN en los movimientos de paso de 1 pb, y la selección de un número adecuado de microestados y macroestados.