Целью данного протокола является выявление структурной динамики одномерной диффузии белка по ДНК с использованием в качестве образцовой системы растительного транскрипционного фактора WRKY доменного белка. Атомное моделирование в рамках построения модели состояния Маркова показывает ступенчатые движения белка 1-bp вдоль ДНК в атомных деталях. В то время как крупнозернистое моделирование сосредоточено на выборке процессных диффузий белка более 10 бит/с вдоль ДНК.
Для начала используйте 10-микросекундную траекторию MD all-atom, чтобы извлечь 10 000 кадров равномерно вперед, одна пара оснований шагающего пути. Подготовьте путь перехода с 10 000 кадрами в VMD, щелкнув Файл и сохранить координаты. Затем введите белок или нуклеин в поле Выбранные атомы.
Выберите «Фреймы» в поле «Фреймы» и нажмите «Сохранить», чтобы получить необходимые кадры. Выровняйте длинную ось эталона от кристаллической структуры ДНК к оси X и установите начальный центр масс полных 34 пар оснований ДНК в начале координатного пространства, щелкнув Расширения, а затем выбрав TkConsole в VMD. После этого введите команду в командном окне TkConsole.
Затем рассчитайте квадратное расстояние между корнем и квадратом белковой магистрали, щелкнув VMD, затем перейдите в раздел Расширения, щелкните Анализ и выберите инструмент траектории RMSD. В поле выбора атомов введите нуклеичные и остаточные от 14 до 23 и от 46 до 55. Щелкните ВЫРОВНЯТЬ, а затем RMSD поле.
Чтобы вычислить степень вращения белка вокруг ДНК тета Т, с начальным угловым позиционированием, определенным как тета 0, на плоскости XY в MATLAB, выполните команду. Введите инструкции в MATLAB для использования методов K-средних и классифицируйте 10 000 структур на 25 кластеров. После этого соберите структуры 25 кластерных центров для дальнейшего моделирования MD.
Чтобы провести первый раунд MD-моделирования, постройте атомистическую систему для 25 структур с помощью GROMACS и файла сборки системы sh. Провести 60 наносекунд MD моделирования для 25 систем в рамках ансамбля ДНЯО с временным шагом в две фемтосекунды путем обработки команды в оболочке. Чтобы сгруппировать траектории первого раунда MD, удалите первые 10 наносекунд каждой траектории моделирования и соберите подтверждения из 25-кратных 50 наносекундных траекторий.
Для независимого от времени компонентного анализа введите скрипт в GROMACS с последующим выбором пар расстояний между белком и ДНК в качестве проекции входных параметров. Из указателя. ndx файл, в новый индекс текстового файла.dat.
Чтобы получить информацию о паре между этими атомами, используйте скрипт Python. Рассчитайте 415 пар расстояний от каждой траектории в командном окне MSMBuilder. Затем проведите независимый по времени компонентный анализ, чтобы уменьшить размерность данных на первые два независимых компонента или вектора, выполнив команду.
При обработке инструкции в MSMBuilder кластеризуйте проектируемые наборы данных в 100 кластеров с помощью метода case center и выберите центральную структуру каждого кластера. Чтобы провести второй раунд моделирования MD, проведите 60 наносекундное моделирование MD, начиная со 100 начальных структур. После наложения случайных начальных скоростей на все атомы, добавьте случайные начальные скорости, включив генерацию скорости в файле MDP.
Удалите первые 10 наносекунд каждого моделирования, как описано ранее. И соберите 2 500 000 снимков со 100-кратных 50 наносекундных траекторий, равномерно, чтобы построить МСМ. Чтобы сгруппировать траектории MD второго раунда, проведите независимый от времени анализ компонентов для траекторий второго раунда в MSMBuilder, как показано на рисунке.
И вычислите подразумеваемую шкалу времени для проверки параметров, выполнив скрипт Python. Затем измените время задержки тау и число микросостояний, изменив параметры. Классифицируйте подтверждения на 500 кластеров, выполнив команду.
Для построения МСМ объедините 500 микрогосударств в три-шесть макрогосударств. Узнать количество макро-состояний, которые подходят лучше всего, по алгоритму PCCAplus в MSMBuilder с помощью скрипта Python. Сопоставьте высокомерные подтверждения с X и углом вращения белка вдоль ДНК для каждого микросостояния.
Чтобы рассчитать среднее время первого прохождения, проведите пять 10-миллисекундных траекторий Монте-Карло, основываясь на матрице вероятности перехода 500 микро-состояний МСМ с временем задержки 10 наносекунд, установленным как шаг времени Монте-Карло. Вычислите среднее время первого прохождения между каждой парой макро-состояний в скрипте Python и среднее значение стандартной погрешности среднего времени первого прохождения с помощью файла Bash. В программном обеспечении CafeMol 3.0 запустите моделирование курса, выполнив команду на терминале.
После указания блоков во Входном файле задайте блок имен файлов и блок job_cntl отдельными командами. Затем установите блок unit_and_state, затем установите блок energy_function и блок md_information. Все подтверждения белка на ДНК были сопоставлены с продольным движением X и углом вращения белка вдоль ДНК, которые могут быть дополнительно сгруппированы в три макросостояния.
Состояние S1 менее благоприятно, так как водородные связи похожи на смоделированную структуру, тогда как S3 относится к метастабильному состоянию, где все водородные связи сместились после шага одной пары оснований и оказались стабильными с самой высокой популяцией 63% Промежуточное состояние S2 соединяет S1 и S3 со средней высокой популяцией 30% Переход S2 в S3 позволяет коллективно разрывать и реформировать водородные связи примерно в семи микросекунды, в то время как переход от S1 к S2 может произойти примерно за 0,06 микросекунды. Были рассчитаны контактные номера между белком и ДНК и идентифицированы четыре состояния. В состояниях 1 и 3 область цинкового пальца связывается в направлении Y.
В то время как в состояниях 2 и 3 область цинкового пальца связывается в направлении Y. Размер шага для каждого сохраненного остатка на различных последовательностях ДНК был измерен, что показало, что размеры шагов этих остатков более синхронизированы на ДНК polyA, чем на полиАТ или случайных последовательностях ДНК. Важными шагами в построении модели состояния Маркова являются выбор пар расстояний между репарациями данных белка и ДНК в ступенчатые движения 1-bp и выбор подходящего количества микро-состояний и макро-состояний.