O objetivo deste protocolo é revelar a dinâmica estrutural da difusão unidimensional de proteína ao longo do DNA, usando um fator de transcrição vegetal proteína de domínio WRKY como um sistema exemplar. As simulações atômicas sob a construção do modelo do estado de Markov revelam movimentos de 1 bp de proteína ao longo do DNA em detalhes atômicos. Enquanto as simulações de grãos grossados se concentram na amostragem de difusões processtivas de proteínas acima de 10 de bps ao longo do DNA.
Para começar, use uma trajetória de MD de 10 microsegundos para extrair 10.000 quadros uniformemente para a frente, um caminho de avanço de um par de bases. Prepare o caminho de transição com 10.000 quadros em VMD clicando em Arquivo e Salvar coordenadas. Em seguida, digite proteína ou nucleic na caixa de átomos selecionados.
Escolha Quadros na caixa de quadros e clique em Salvar para obter os quadros necessários. Alinhe o longo eixo da referência da estrutura cristalina do DNA ao eixo x e defina o centro inicial de massa dos 34 pares de base completos DNA na origem do espaço de coordenadas clicando em Extensões e, em seguida, selecionando TkConsole em VMD. Depois, digite o comando na janela de comando TkConsole.
Em seguida, calcule a raiz significa distância quadrada do backbone da proteína clicando em VMD, em seguida, vá para Extensões, clique em Análise e selecione a Ferramenta de Trajetória RMSD. Na caixa de seleção de átomos, tipo nucleico e resíduo 14 a 23, e 46 a 55. Clique em Alinhar e, em seguida, caixa RMSD.
Para calcular o grau rotacional de proteína em torno do DNA theta T, com o posicionamento angular inicial definido como 0, no plano XY em MATLAB, execute o comando. Digite as instruções no MATLAB para usar métodos de meios K e classifique as 10.000 estruturas em 25 clusters. Uma vez feito, reúna as estruturas dos 25 centros de cluster para mais simulação de MD.
Para realizar a simulação de MD na primeira rodada, construa um sistema atomístico para as 25 estruturas usando GROMACS e o arquivo sh do sistema de compilação. Realize 60 simulações de MD de nanossegundos para os 25 sistemas sob conjunto NPT com uma etapa de tempo de dois femtosegundos processando o comando em shell. Para agrupar as trajetórias de MD da primeira rodada, remova os primeiros 10 nanossegundos de cada trajetória de simulação e colete confirmações das trajetórias de 25 vezes 50 nanossegundos.
Para a análise de componentes independentes do tempo, digite o script no GROMACS, seguido pela escolha de pares de distância entre proteína e DNA como projeção de parâmetros de entrada. Do índice. arquivo ndx, para um novo índice de arquivo de texto.dat.
Para obter a informação do par entre esses átomos, use o script Python. Calcule os pares de 415 distâncias de cada trajetória na janela de comando MSMBuilder. Em seguida, realize uma análise de componentes independentes do tempo para reduzir a dimensão dos dados nos primeiros componentes ou vetores independentes duas vezes executando o comando.
Com o processamento da instrução no MSMBuilder, agglomere os conjuntos de dados projetados em 100 clusters usando o método do case center e selecione a estrutura central de cada cluster. Para realizar a simulação de MD em segundo turno, realize 60 simulações de MD nanossegundos a partir das 100 estruturas iniciais. Depois de impor velocidades iniciais aleatórias em todos os átomos, adicione as velocidades iniciais aleatórias ligando a geração Velocity no arquivo MDP.
Remova os primeiros 10 nanossegundos de cada simulação, conforme descrito anteriormente. E coletar 2.500.000 instantâneos das trajetórias de 100 vezes 50 nanossegundos, uniformemente, para construir o MSM. Para agrupar trajetórias de MD em segundo turno, realize a análise de componentes independentes de tempo para as trajetórias da segunda rodada no MSMBuilder, como mostrado.
E calcule a escala de tempo implícita para validar parâmetros executando o script Python. Em seguida, varie o tempo de atraso tau e o número de micro-estados alterando os parâmetros. Classifique as confirmações em 500 clusters executando o comando.
Para a construção da MSM, coloque os 500 microestróis em três a seis macroestró estados. Para descobrir o número de macro-estados que melhor se adequam, de acordo com o algoritmo PCCAplus no MSMBuilder usando o script Python. Mapeie as confirmações de alta dimensão para o X e ângulo rotacional da proteína ao longo do DNA para cada micro-estado.
Para calcular os tempos médios de primeira passagem, realize cinco trajetórias de Monte Carlo de 10 milissegundos, com base na matriz de probabilidade de transição do MSM de 500 micro-estados com o tempo de defasagem de 10 nanossegundos definido como o passo do tempo de Monte Carlo. Calcule os tempos médios de primeira passagem entre cada par de macro-estados dentro do script Python e a média de erro padrão dos primeiros tempos de passagem médios usando o arquivo Bash. No software CafeMol 3.0, execute a simulação de curso executando o comando no terminal.
Depois de especificar os blocos no arquivo Entrada, defina o bloco de nomes de arquivos e o bloco job_cntl com os comandos individuais. Em seguida, defina o bloco unit_and_state, seguido da configuração do bloco energy_function e do bloco md_information. Todas as confirmações proteicas no DNA foram mapeadas para o movimento longitudinal X e ângulo de rotação da proteína ao longo do DNA, que pode ser ainda mais agrupado em três macro-estados.
O estado S1 é menos favorável, pois as ligações de hidrogênio são semelhantes à estrutura modelada, enquanto o S3 refere-se a um estado metastável onde todas as ligações de hidrogênio mudaram após um par de base pisar e apareceram estáveis com a maior população de 63%O estado intermediário S2 conecta S1 e S3 com uma população média alta de 30% A transição de S2 para S3 permite a quebra coletiva e reforma das ligações de hidrogênio em aproximadamente sete microsegundos, enquanto a transição S1 para S2 pode ocorrer em aproximadamente 0,06 microssegundos. Os números de contato entre proteína e DNA foram calculados e foram identificados quatro estados. Nos estados 1 e 3, a região do dedo de zinco se liga à direção Y.
Considerando que nos estados 2 e 3, a região do dedo de zinco se liga à direção Y. O tamanho do passo para cada resíduo conservado em diferentes sequências de DNA foi medido, o que revelou que os tamanhos de passo desses resíduos são mais sincronizados no DNA polia do que em sequências de DNA policiais ou aleatórias. Os passos importantes na construção do modelo do estado de Markov são a escolha de pares de distância entre os reparos de dados de proteínas e DNA nos movimentos de 1 bp e a seleção de um número adequado de micro-estados e macro-estados.