이 프로토콜의 목표는 식물 전사 인자 WRKY 도메인 단백질을 모범적 인 시스템으로 사용하여 DNA를 따라 단백질의 일차원 확산의 구조적 역학을 밝히는 것입니다. 마르코프 상태 모델 구성에 따른 원자 시뮬레이션은 원자 세부 사항에서 DNA를 따라 단백질의 1bp 스테핑 모션을 보여줍니다. 거친 입자 시뮬레이션은 DNA를 따라 10 bps 이상의 단백질 처리 확산의 샘플링에 중점을 둡니다.
시작하려면 10마이크로초 전원자 MD 궤적을 사용하여 10, 000 프레임을 고르게 앞으로 추출하고 하나의 염기쌍 스테핑 경로를 추출합니다. 파일 및 좌표 저장을 클릭하여 VMD에서 10, 000프레임으로 전환 경로를 준비합니다. 그런 다음 선택한 원자 상자에 단백질 또는 핵산을 입력합니다.
프레임 상자에서 프레임을 선택하고 저장을 클릭하여 필요한 프레임을 가져옵니다. DNA의 결정 구조에서 x축으로 참조의 긴 축을 정렬하고 확장을 클릭한 다음 VMD에서 TkConsole을 선택하여 좌표 공간의 원점에서 전체 34개 염기쌍 DNA의 초기 질량 중심을 설정합니다. 그런 다음 TkConsole 명령 창에 명령을 입력합니다.
그런 다음 VMD를 클릭하여 단백질 백본의 루트 평균 제곱 거리를 계산한 다음 확장으로 이동하여 분석을 클릭하고 RMSD 궤적 도구를 선택합니다. 원자 선택 박스에서, 핵산 및 잔기 14 내지 23, 및 46 내지 55를 입력한다. 정렬을 클릭한 다음 RMSD 상자를 클릭합니다.
DNA 세타 T를 중심으로 단백질의 회전 정도를 계산하려면 MATLAB의 XY 평면에서 세타 0으로 정의 된 초기 각도 위치를 사용하여 명령을 실행하십시오. MATLAB에 K-means 메서드를 사용하도록 지침을 입력하고 10,000개의 구조를 25개의 클러스터로 분류합니다. 완료되면 추가 MD 시뮬레이션을 위해 25 클러스터 센터의 구조를 수집하십시오.
첫 번째 라운드 MD 시뮬레이션을 수행하려면 GROMACS와 빌드 시스템 sh 파일을 사용하여 25 개의 구조에 대한 원자 시스템을 구축하십시오. NPT 앙상블 아래 25개 시스템에 대해 60나노초 MD 시뮬레이션을 수행하고 셸에서 명령을 처리하여 두 펨토초의 시간 단계를 수행합니다. 첫 번째 라운드 MD 궤적을 클러스터링하려면 각 시뮬레이션 궤적의 처음 10나노초를 제거하고 25배 50나노초 궤적에서 확인을 수집합니다.
시간 독립적 구성 요소 분석을 위해 GROMACS에 스크립트를 입력한 다음 입력 매개 변수 투영으로 단백질과 DNA 사이의 거리 쌍을 선택합니다. 인덱스에서. ndx 파일, 새 텍스트 파일 인덱스.dat.
이 원자들 사이의 쌍 정보를 얻으려면 Python 스크립트를 사용하십시오. MSMBuilder 명령 창의 모든 궤적에서 415개의 거리 쌍을 계산합니다. 다음으로, 시간 독립적 성분 분석을 수행하여 명령을 실행하여 처음 두 개의 시간 독립적 구성 요소 또는 벡터로 데이터의 차원을 줄입니다.
MSMBuilder에서 명령을 처리하면 케이스 센터 방법을 사용하여 프로젝션된 데이터 세트를 100개의 클러스터로 클러스터링하고 각 클러스터의 중심 구조를 선택합니다. 두 번째 라운드 MD 시뮬레이션을 수행하려면 100개의 초기 구조에서 시작하여 60나노초 MD 시뮬레이션을 수행합니다. 모든 원자에 임의의 초기 속도를 부과 한 후 MDP 파일에서 속도 생성을 켜서 임의의 초기 속도를 추가하십시오.
앞서 설명한 대로 각 시뮬레이션의 처음 10나노초를 제거합니다. 100번 50나노초 궤적으로부터 2, 500, 000개의 스냅샷을 고르게 수집하여 MSM을 구축한다. 두 번째 라운드 MD 궤적을 클러스터링하려면 그림과 같이 MSMBuilder에서 두 번째 라운드 궤적에 대한 시간 독립적 성분 분석을 수행하십시오.
그리고 암시 적 시간 척도를 계산하여 Python 스크립트를 실행하여 매개 변수의 유효성을 검사합니다. 이어서, 래그 시간 타우 및 마이크로-상태 수를 파라미터를 변경함으로써 변화시킨다. 명령을 실행하여 확인을 500개의 클러스터로 분류합니다.
MSM 건설을 위해 500 개의 마이크로 상태를 세 개에서 여섯 개의 매크로 상태로 묶으십시오. MSMBuilder의 PCCAplus 알고리즘에 따라 Python 스크립트를 사용하여 가장 적합한 매크로 상태의 수를 찾으십시오. 고차원 확인을 각 미세 상태에 대한 DNA를 따라 X와 단백질의 회전 각도에 매핑하십시오.
평균 첫 번째 통과 시간을 계산하려면 몬테카를로의 시간 단계로 설정된 10나노초의 지연 시간을 갖는 500 마이크로 상태 MSM의 전이 확률 매트릭스를 기반으로 5개의 10밀리초 몬테카를로 궤적을 수행하십시오. Python 스크립트 내의 각 매크로 상태 쌍 간의 평균 첫 번째 통과 시간과 Bash 파일을 사용하여 평균 첫 번째 통과 시간의 표준 오차 평균을 계산합니다. CafeMol 3.0 소프트웨어에서 터미널에서 명령을 실행하여 코스 그레인 시뮬레이션을 실행합니다.
입력 파일에서 블록을 지정한 후 개별 명령으로 파일 이름 블록과 job_cntl 블록을 설정합니다. 그런 다음 unit_and_state 블록을 설정 한 다음 energy_function 블록과 md_information 블록을 설정합니다. DNA에 대한 모든 단백질 확인은 DNA를 따라 단백질의 종방향 이동 X 및 회전 각도에 매핑되었으며, 이는 세 개의 매크로 상태로 더 클러스터링될 수 있다.
S1 상태는 수소 결합이 모델링 된 구조와 유사하기 때문에 덜 유리한 반면, S3는 1 염기 쌍 스테핑 후 모든 수소 결합이 이동하고 63 %의 가장 높은 인구로 안정적으로 나타나는 형안정 상태를 나타냅니다 중간 상태 S2는 S1과 S3을 30 %의 중간 높은 인구와 연결합니다 S2에서 S3으로의 전환은 약 7 %에서 수소 결합의 집단 파괴 및 개질을 허용합니다. 마이크로초 반면 S1에서 S2로의 천이는 대략 0.06 마이크로초 내에 발생할 수 있다. 단백질과 DNA 사이의 접촉 수를 계산하고 네 가지 상태를 확인했습니다. 상태 1 및 3에서, 징크 핑거 영역은 Y 방향을 향해 결합한다.
반면 상태 2 및 3에서는 징크 핑거 영역이 Y 방향으로 결합합니다. DNA의 상이한 서열 상의 각각의 보존된 잔기에 대한 스테핑 크기를 측정하였고, 이는 이들 잔기의 스테핑 크기가 polyAT 또는 랜덤 DNA 서열보다 polyA DNA 상에서 더 동기화된다는 것을 밝혀냈다. 마르코프 상태 모델 구축의 중요한 단계는 단백질과 DNA 데이터 복구 사이의 거리 쌍을 1-bp 스테핑 동작으로 선택하고 적절한 수의 마이크로 상태 및 매크로 상태를 선택하는 것입니다.