Method Article
Представлен протокол для онлайн-исследования взаимосвязей структуры-структуры-динамики белка с использованием Bio3D-web.
Мы демонстрируем использование Bio3D-web для интерактивного анализа данных биомолекулярной структуры. Веб-приложение Bio3D предоставляет онлайн-функции для: (1) идентификация связанной структуры белка устанавливает пользовательские пороговые значения сходства; (2) их множественное выравнивание и наложение структуры; (3) Анализ сохранения последовательности и структуры; (4) Отображение отношений между конформерами с анализом основных компонент и (5) сравнение предсказанной внутренней динамики с помощью ансамблевого нормального режима анализа. Эта интегрированная функциональность обеспечивает полный интерактивный рабочий процесс для исследования последовательностей-динамических отношений внутри белковых семейств и суперсемейств.
В настоящее время банк данных о белках содержит более 120 000 белковых структур, многие из которых имеют одно и то же семейство белков, но разрешаются в разных экспериментальных условиях. Эти множественные структуры представляют собой бесценный ресурс для понимания тонкостей белковой формы и функции. Например, строгое сопоставление этих структурных ансамблей может выявить важные молекулярные механизмы 1 , 2 , 3 и проинформировать о конформационной динамике, связанной с процессами, включая связывание лиганда, ферментативный катализ и бимолекулярное распознавание 4 , 5 , 6 , 7 . Новые подробности могут быть получены из подробного крупномасштабного анализа последовательности, структуры и динамики семейств белков. Однако это, как правило, требует значительного биоинфекцииОпыта в области оргматики и компьютерного программирования, а также знакомство с изучаемыми белковыми системами. Например, программные пакеты, такие как Bio3D, ProDy и Maven, требуют программирования в R, python и Matlab соответственно 8 , 9 , 10 . Напротив, онлайн-инструменты для анализа структурной гибкости обычно ограничиваются исследованием отдельных структур 11 , 12 . Исключением в этом отношении является недавно разработанный сервер WebNM @, который позволяет сравнивать шаблоны гибкости, полученные из анализа нормального режима (NMA) нескольких предварительно настроенных пользовательских структур 13 . Однако на этом сервере отсутствует автоматизированная процедура идентификации структур для сравнения, их выравнивания или дальнейшего анализа за пределами NMA. Еще один недавний вклад - онлайн-база данных PDBFlex, которая представляет собой предварительнуюOmputed анализ структур PDB, разделяющих 95% или более позднюю идентичность 14 . Однако анализ более разнообразных наборов структур в настоящее время недоступен.
Ранее мы представили Bio3D-web - простое в использовании веб-приложение для анализа взаимосвязей между структурой и структурой последовательности белка 15 . Bio3D-web уникален в обеспечении простой в использовании интегрированной функциональности для идентификации, сравнения и детального анализа больших наборов гомологичных структур в Интернете. Здесь мы представляем подробный протокол для онлайн-исследования взаимосвязи структуры и структуры последовательности белка с использованием Bio3D-web. Bio3D-web предоставляет множество функций для поддержки пяти основных этапов анализа данных, показанных на рисунке 1 и подробно обсуждаемых ниже. Эти этапы представляют собой рабочий процесс, который охватывает последовательность запросов или структуру ввода, посредством нескольких уровней последовательности-структуры-динамического анализа, с целью обобщенияВывода. Результаты доступны сразу через обширные средства визуализации и построения графиков в браузере, а также путем загрузки файлов результатов в широко используемых форматах. В дополнение к удобному удобному динамическому интерфейсу для изучения эффектов выбора параметров и методов, Bio3D-web также записывает полный ввод пользователя и последующие графические результаты сеанса пользователя в виде совместного воспроизводимого отчета в форматах PDF, DOC и HTML. Пользовательские сессии могут быть сохранены и перезагружены в будущем, а результаты будут загружены и дополнительно интерпретированы пакетом Bio3D R на локальной машине пользователя.
Bio3D-web питается от Bio3D R-пакета для анализа данных биомолекулярной структуры, последовательности и молекулярного моделирования 8 , 16 . В частности, алгоритмы Bio3D для идентификации жесткого ядра 8 , суперпозиция, анализ основных компонентов(PCA) 8 , и анализ нормального режима ансамбля (eNMA) 16 составляют основу приложения. Мы также используем протоколы Bio3D, которые зависят от pHMMER 17 для идентификации связанных структур белка и MUSCLE 18 для множественного выравнивания последовательностей. Структура и аннотации последовательностей выводятся с помощью утилит Bio3D из баз данных RCSB PDB 19 и PFAM 20 . Bio3D-web можно запустить с нашего онлайн-сервера или установить локально на любом компьютере под управлением R. Bio3D-web открыт для всех пользователей и предоставляется бесплатно по лицензии GPL-3 с открытым исходным кодом: http: // thegrantlab. орг / bio3d / WebApps
ПРИМЕЧАНИЕ. Типичная веб-сессия Bio3D проходит через пять последовательных и зависимых шагов (см. Рисунок 1 для схематического представления). Каждый шаг реализуется как последовательная вкладка навигации веб-приложения, а именно SEARCH, ALIGN, FIT, PCA и eNMA.
1. Поиск и выбор структуры (ПОИСК)
2, Анализ согласованности нескольких последовательностей (ALIGN)
3. Структура и анализ структуры (FIT)
4. Анализ основных компонентов (PCA)
5. Анализ нормального режима ансамбля (eNMA)
Аденилат-киназа (Adk) является вездесущим ферментом, который функционирует для поддержания равновесия между цитоплазматическими нуклеотидами, необходимыми для многих клеточных процессов. Adk работает, катализируя обратимый перенос фосфорильной группы из АТФ в AMP. Эта реакция сопровождается хорошо изученными скоростными конформационными переходами 3 , 21 . Здесь мы анализируем все имеющиеся в настоящее время структуры Adk с Bio3D-web, чтобы выявить подробные характеристики и механистические принципы этих существенных переходов.
Мы можем начать наш Bio3D-веб-анализ Adk, введя код RCSB PDB любой известной структуры Adk. Например, ввод идентификатора PDB 1AKE в панели A на вкладке SEARCH возвращает 167 аналогичных структур, из которых верхний 26 автоматически выбирается для дальнейшего анализа (см. Панель B). Представленная аннотацияEd на панели C указывает, что эти выбранные структуры все из E. coli были решены с помощью рентгеновской дифракции в диапазоне пространственных групп; Имеют диапазон разрешений от 1,63 до 2,8 Å и сокристаллизовываются с рядом различных лигандов (включая лиганды, AMP, ADP, MG и ингибитор AP5). Обратите внимание, что дополнительные детали аннотации можно отобразить, нажав кнопку «Показать / скрыть столбцы» на панели C.
При вводе вкладки ALIGN выполняется выравнивание нескольких последовательностей. Первая панель вкладки ALIGN отображает сводку выравнивания, в которой подробно описывается количество строк последовательности (эквивалентно количеству структур PDB), а также количество позиций ( то есть столбцов выравнивания). Это включает в себя спецификацию количества столбцов с пробелом и без зазора. Рисунок справа от первой строки обеспечивает схематическое изображение выравнивания последовательности. ЗдесьСерые области представляют собой нелокальные позиции, а белые области в выравнивании соответствуют разрыву. Представление сохранения последовательности показано выше выравнивания с красными областями, указывающими хорошо сохраненные позиции, а белый - менее консервативным. Обратите внимание, что последовательности на этом рисунке упорядочены в зависимости от их сходства, предоставляемого кластерирующей дендрограммой с левой стороны. Вторая панель этой вкладки дополнительно облегчает кластеризацию выбранных PDB на основе их сходства по парной последовательности, которые могут быть визуализированы либо в виде дендрограммы, либо в виде тепловой карты. По умолчанию показана дендрограмма (или древовидная диаграмма), представляющая расположение кластеров. Ось оси дендрограммы представляет собой расстояние (в терминах идентичности последовательности) между кластерами.
Наложение суперпозиции выполняется автоматически при входе на вкладку FIT. Наложенные структуры, отображаемые интерактивно в панели A, indicaТ. Е. Наличие относительно жесткой области сердцевины (охватывающей остатки 1-29, 68-117 и 161-214, см. Панель «необязательное ядро и RMSD детали» в нижней части вкладки FIT для деталей). Также хорошо видны еще две области с переменным нуклеотидным связыванием (остатки 30-67 и 118-167) ( рисунок 2 ). RMSD-кластеры группируют эти структуры в две различные конформации.
Нажатие на вкладке PCA более четко показывает взаимосвязь между структурами с точки зрения смещений этих областей, которые эффективно закрывают связанные связанные нуклеотидные виды в смежных структурах ( рис. 2B и 2C ). Большинство структур находятся в «закрытой» форме (голубой на рисунке 2C ) и связаны с лигандом или ингибитором. Напротив, более «открытые» конформации не содержат нуклеотидов и ингибиторов. Это согласуется сОбширный объем исследований структуры и динамики Adk, указывающий на то, что для нуклеотидного связывания необходима открытая конфигурация этих областей и замкнутая конформация для эффективного переноса фосфорила и подавления вредных событий гидролиза. Примечательно, что один ПК фиксирует 97% общего смещения среднего квадрата в этом наборе структуры Adk и дает четкое и убедительное описание открытого с закрытым переходом вместе с отдельными вкладами вклада в это функциональное смещение (панель C приложения И рис. 2 ).
Посещение вкладки NMA и увеличение количества рассмотренных для расчета структур (путем уменьшения отсечки для фильтрации подобных структур) указывает на то, что открытые государственные структуры демонстрируют улучшенную локальную и глобальную динамику по сравнению с структурами закрытой формы ( рисунок 2D и панель приложения C) , Сравнение результатов PCA и NMA дляОтдельные панели (панель D) указывают на то, что первый режим всех структур открытой формы отображает относительно высокое перекрытие с PC1 (со средним значением 0,37 ± 0,04). Напротив, структуры закрытой формы отображают более низкие значения (со средним значением 0,30 ± 0,01). Значения RMSIP для структур открытой формы (0,62 ± 0,003) также выше, чем у закрытых структур (0,56 ± 0,008). Кроме того, анализ перекрытия показывает, что первые моды открытого состояния хорошо согласуются с конформационным изменением, которое описывает разность открытых и закрытых состояний (панель E). Кластеризация на основе значений RMSIP снова отображает последовательное разбиение открытых и закрытых государственных структур (панель F).
В совокупности эти результаты указывают на существование двух значительных конформационных состояний для Adk. Они различаются коллективным низкочастотным смещением двух нуклеотидсвязывающих участков участка, которые отображают различные flexibiПри нуклеотидном связывании.
Рисунок 1: Обзор Bio3D-web с снимками экрана вкладок PCA и NMA. Bio3D-web использует предоставленную пользователем структуру белка или последовательность в качестве входных данных на вкладке SEARCH ( 1 ). Сервер предоставляет список связанных структур, которые могут быть выбраны для дальнейшего анализа. ( 2 ) Вкладка ALIGN обеспечивает выравнивание последовательности и анализ структур, выбранных на вкладке SEARCH. ( 3 ) На вкладке FIT все структуры накладываются и визуализируются в 3D вместе с результатами традиционного парного анализа структуры. ( 4 ) Анализ основных компонентов набора структур выполняется на вкладке PCA для описания отношений между конформерами. ( 5 ) Анализ нормальной моды для каждой структуры может быть выполнен на вкладке eNMAДля изучения динамических тенденций существующих структурных состояний. Нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.
Рисунок 2: Результаты Bio3D-веб-анализа аденилаткиназы. ( A ) Доступные структуры PDB аденилат киназы, наложенные на идентифицированный инвариантный сердечник. Структуры окрашены в соответствии с кластеризацией на основе RMSD, предусмотренной на вкладке FIT. ( B ) Визуализация основных компонентов доступна на вкладке PCA, чтобы охарактеризовать основные конформационные изменения в наборе данных. Здесь траектория, соответствующая первому главному компоненту, показана в трубном представлении, показывающем крупномасштабное замыкающее движение белка. ( C ) Структуры являются prНаложенные на их две первые главные компоненты на конформерном графике, показывающие низкоразмерное представление конформационной изменчивости. Каждая точка (или структура) окрашена в соответствии с указанными пользователем критериями, в этом случае результаты кластеризации на основе PCA. ( D ) Анализ нормального режима на вкладке eNMA предлагает усиленную локальную и глобальную динамику для структур в открытом состоянии (красный) по сравнению с закрытыми (синими) структурами. Нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.
Bio3D-web может использоваться для интерактивного изучения и отображения структурных, динамических и функциональных состояний белков из доступных кристаллографических структур. Кроме того, результаты кластеризации на основе NMA и PCA, а также аннотации и анализ, основанный на последовательности, могут быть особенно полезны для выбора репрезентативных структур для более трудоемкого анализа, такого как стыковка небольших молекул молекулы или моделирование молекулярной динамики. Таким образом, Bio3D-web облегчает расширенный анализ структурной биоинформатики для более широкого круга исследователей путем снижения необходимого уровня технической экспертизы. Нынешний дизайн Bio3D-web подчеркивает простоту в отношении исчерпывающего включения многих методов анализа, доступных в полном автономном пакете Bio3D. Во многих случаях предполагается, что исследователи будут использовать Bio3D-web для понимания общих тенденций в их семействе белков или надсемейства, которые могут затем сообщать более специализированные анализы. Bio3D-web - этоРазработанный для быстрого изучения наборов данных биомолекулярной структуры и для работы в качестве инструмента генерации гипотез. Мы поощряем пользователей к дальнейшему изучению их данных, предоставляя пример кода Bio3D в воспроизводимом отчете, который также хранит все данные запроса и результаты анализа.
В представленном выше примере примера мы показываем способность Bio3D-web выявлять структурные особенности функциональных конформационных переходов Adk. Дополнительные приложения Bio3D-web включают структурный и динамический анализ загруженных пользователем структур PDB. Например, пользователь может загружать новые структуры или даже последовательности белка для анализа. Вышеупомянутые этапы анализа, особенно шаг eNMA, могут выявить как локальные, так и глобальные тенденции в движениях белков, причем коллективные движения имеют функциональное значение. Сравнение с структурами апо также может выявить характеристики несвязанных к связанным конформационным переходам. Дополнительные примеры примененияРяд различных семейств белков предоставляется онлайн.
Хотя все белки являются гибкими и динамическими сущностями, не все белки имеют структуры атомного разрешения, доступные в разных состояниях ( например, в активных и неактивных состояниях). Таким образом, наш взгляд на структуру белковой структуры ограничен, и, следовательно, проницательность, полученная из таких инструментов, как Bio3D-web, также ограничена для определенных белков. Однако с нынешними технологическими достижениями и новыми инициативами по структурной геномике представленный здесь протокол будет все чаще становиться важным маршрутом для получения понимания важных структурно-функциональных отношений. Критический шаг, который особенно важен при анализе более отдаленных связанных белков, - это потенциальное появление ошибок выравнивания на вкладке ALIGN. Ошибки выравнивания неизбежно возникают, когда сходство последовательностей падает ниже 30%, и пользователь должен в таких случаях дважды проверять и корректировать выравнивание последовательностиНа вкладке ALIGN. Ошибки выравнивания могут привести к неправильным наложенным структурам на вкладке FIT и маскировать наиболее соответствующие конформационные вариации для последующего СПС. Кроме того, пользователь должен знать о недостатках остатков в выбранных структурах PDB, так как в текущей реализации PCA может выполняться только на остатках белка, в которых все структуры имеют соответствующий углерод-альфа-атом. Следовательно, если выбранный PDB имеет нерешенные остатки для конкретной области белка, эта область будет исключена из PCA.
Bio3D-web в настоящее время ограничивается анализом одноцепочечных структур PDB. Следовательно, функциональные движения, происходящие на четвертичном уровне, не могут быть изучены с использованием текущего протокола. Хотя в настоящее время мы разрабатываем новые алгоритмы для включения такого анализа в Bio3D-web, единственным текущим вариантом является использование обычного Bio3D.
Bio3D-web - единственное онлайн-приложениеКоторый позволяет запрашивать и идентифицировать наборы структур, интерпретировать их закономерности последовательности и структурной изменчивости и извлекать механистическую информацию как из анализа, так и для прогнозирования их структурной пластичности. Широкий спектр инструментов молекулярной визуализации и онлайн-серверов позволяет исследователям исследовать и анализировать отдельные биомолекулярные структуры. Однако существующие инструменты для анализа последовательности, структуры и динамики крупных гетерогенных семейств белков часто требуют значительных вычислительных знаний и обычно остаются доступными только для пользователей с соответствующими навыками программирования. Например, для пакета Bio3D требуется R 8 , для ProDy требуется питон, а Maven требует знания Matlab 9 , 10 . Bio3D-web в отличие от этого не требует знания программирования и, таким образом, увеличивает доступность и уменьшает входной барьер для выполнения расширенной сравнительной последовательности, структуры и dyАнализ динамики. Кроме того, подготовка, сведение, аннотация и очистка молекулярных структур, которые часто необходимы для эффективного анализа, включены в веб-службу Bio3D. Кроме того, ограничение на выполнение такого анализа на способных вычислительных ресурсах облегчается нашим экземпляром сервера, который позволяет широкомасштабный анализ многих структур, которые можно инициировать и контролировать из любого современного веб-браузера.
Открытая разработка Bio3D-сети продолжается (см. Https://bitbucket.org/Grantlab/bio3d). Мы продолжаем добавлять новые функции анализа и улучшать существующие методы. Будущее развитие будет сосредоточено на добавлении PCA на основе пространственной матрицы и крутильных PCA, более широких подходах сохранения последовательности, которые включают филогенетический компонент, идентификацию сайта привязки ансамбля и новые подходы к динамическому сетевому анализу в семействах белков. В этом отношении текущее веб-приложение представляет собой отправную точкуT для многих других совместных структурных процессов биоинформационного анализа, позволяя воспроизводимые и совместно используемые этапы на пользовательских наборах экспериментальных структур. Мы также планируем будущую поддержку восстановленных наборов координат биологических единиц в дополнение к индивидуальным и множественным цепям из асимметричной единицы структур PDB. Дополнительные функции будут включать улучшенную экономию и загрузку совместных рабочих пространств вместе с возможностью отмены.
Bio3D-web - это онлайн-приложение для интерактивного анализа данных о структуре биомолекулярной структуры. Bio3D-web работает в любом современном веб-браузере и обеспечивает функциональность для: (1) идентификация связанной структуры белка устанавливает пользовательские пороговые значения сходства; (2) их множественное выравнивание и наложение структуры; (3) Анализ сохранения последовательности и структуры; (4) Отображение отношений между конформерами с анализом главных компонент и (5) сравнение предсказанной внутренней динамики через ансамбль иМалый режим анализа. Эта интегрированная функциональность обеспечивает полный рабочий процесс для исследования последовательностей-динамических отношений внутри белковых семейств и надсемейств. В дополнение к удобному легкому использованию динамического интерфейса для изучения эффектов выбора параметров и методов, Bio3D-web также записывает полный ввод пользователя и последующие графические результаты сеанса пользователя. Это позволяет пользователям легко делиться и воспроизводить последовательность шагов анализа, которые создали их результаты. Bio3D-web полностью реализован на языке R и основан на пакетах Bio3D и Shiny R. Его можно запустить с нашего онлайн-сервера или установить локально на любом компьютере под управлением R. Это включает установку локального сервера, чтобы предоставить настраиваемому экземпляру нескольких пользователей доступ к приоритетным структурным наборам данных, таким как распространенные в фармацевтической промышленности. Полный исходный код и обширная документация предоставляются по лицензии GPL-3 с открытым исходным кодом: http://thegrantlab.org/ Bio3d / WebApps
Авторы заявляют, что у них нет конкурирующих финансовых интересов.
Мы благодарим доктора Гвидо Скарабелли и Хонгьяна Ли за всестороннее тестирование на протяжении всего развития, а также сообщество пользователей Bio3D и участников семинара по структурной биоинформатике Университета Бергена за отзывы и комментарии, которые улучшили это приложение.
Name | Company | Catalog Number | Comments |
Bio3D-web | |||
Web-site | http://thegrantlab.org/bio3d-web/ | ||
Requirements | Web browser |
Запросить разрешение на использование текста или рисунков этого JoVE статьи
Запросить разрешениеThis article has been published
Video Coming Soon
Авторские права © 2025 MyJoVE Corporation. Все права защищены