Method Article
Se presenta un protocolo para la investigación en línea de relaciones de secuencia-estructura-dinámica de proteínas usando Bio3D-web.
Demostramos el uso de Bio3D-web para el análisis interactivo de datos de estructura biomolecular. La aplicación Bio3D-web proporciona funcionalidad en línea para: (1) La identificación de conjuntos de estructuras de proteínas relacionados con los umbrales de similitud especificados por el usuario; (2) Su superposición de alineación y estructura múltiple; (3) Análisis de la secuencia y la conservación de la estructura; (4) Cartografía de la relación interconformidad con el análisis del componente principal y (5) comparación de la dinámica interna predicha mediante el análisis del modo normal del conjunto. Esta funcionalidad integrada proporciona un flujo de trabajo en línea completo para investigar las relaciones dinámicas de secuencia-estructura dentro de familias de proteínas y superfamilias.
El banco de datos de proteínas (PDB) contiene ahora más de 120.000 estructuras de proteínas - muchas de las cuales son de la misma familia de proteínas pero resueltas bajo diferentes condiciones experimentales. Estas estructuras múltiples representan un recurso invaluable para entender las complejidades de la forma y de la función de la proteína. Por ejemplo, la comparación rigurosa de estos conjuntos de estructuras puede revelar importantes mecanismos moleculares 1 , 2 , 3 e informar sobre la dinámica conformacional involucrados en procesos que incluyen ligando ligando, catálisis enzimática y reconocimiento bi-molecular 4 , 5 , 6 , 7 . A menudo se pueden obtener nuevas ideas a partir del detallado análisis a gran escala de la secuencia, estructura y dinámica de las familias de proteínas. Sin embargo, esto requiere típicamenteOrmatics y experiencia de programación de la computadora junto con la familiaridad con los sistemas de la proteína bajo estudio. Por ejemplo, paquetes de software como Bio3D, ProDy y Maven requieren la programación en R, python y Matlab, respectivamente 8 , 9 , 10 . Por el contrario, las herramientas en línea para el análisis de la flexibilidad estructural se limitan generalmente a la investigación de las estructuras individuales [ 11 , 12] . Una excepción a este respecto es el recientemente desarrollado WebNM @ servidor, que permite la comparación de los patrones de flexibilidad obtenidos a partir de análisis de modo normal (NMA) de varias estructuras precalíneas usuario especificado 13 . Sin embargo, este servidor carece de un procedimiento automatizado para la identificación de estructuras para comparación, su alineación o análisis posterior más allá de NMA. Otra contribución reciente es la base de datos en línea PDBFlex, que presenta pre-cOmputed análisis de las estructuras de PDB que comparten el 95% o más de la secuencia de identidad [ 14] . Sin embargo, el análisis de conjuntos de estructuras más diversos no está actualmente disponible.
Anteriormente hemos presentado Bio3D-web - una aplicación web fácil de usar para el análisis de la proteína de la secuencia de estructura dinámica relaciones [ 15] . Bio3D-web es único en proporcionar funcionalidad integrada fácil de usar para la identificación, comparación y análisis detallado de grandes conjuntos de estructuras homólogas en línea. Aquí presentamos un protocolo detallado para la investigación en línea de proteína relación secuencia-estructura-dinámica utilizando Bio3D-web. Bio3D-web proporciona una variedad de funciones para soportar los cinco pasos principales del análisis de datos mostrados en la Figura 1 y discutidos en detalle a continuación. Estos pasos constituyen un flujo de trabajo que abarca desde la secuencia de consulta o entrada de estructura, a través de múltiples niveles de secuencia-estructura-análisis dinámico, hasta resumirGeneración de informes. Los resultados están disponibles de inmediato a través de extensa visualización en el navegador y dispositivos de trazado, así como a través de la descarga de archivos de resultados en formatos comúnmente utilizados. Además de una interfaz dinámica fácil de usar para explorar los efectos de las opciones de parámetros y métodos, Bio3D-web también registra la entrada completa del usuario y los resultados gráficos subsiguientes de la sesión de un usuario como un informe reproducible compartible en formatos PDF, DOC y HTML. Las sesiones de usuario se pueden guardar y volver a cargar en el futuro y completar los resultados descargados e interpretados por el paquete Bio3D R en la máquina local de un usuario.
Bio3D-web es impulsado por el Bio3D R paquete para el análisis de la estructura biomolecular, la secuencia y la simulación molecular de datos [ 8 , 16] . En particular, los algoritmos Bio3D para la identificación de núcleos rígidos 8 , superposición, análisis de componentes principales(PCA) 8 y el análisis de modo normal de conjunto (eNMA) 16 forman la base de la aplicación. También utilizamos protocolos Bio3D que dependen de pHMMER 17 para la identificación de estructuras proteicas relacionadas, y MUSCULO 18 para la alineación de múltiples secuencias. Las anotaciones de estructura y secuencia se derivan a través de las utilidades de Bio3D de las bases de datos 19 del PDSB de RCSB y PFAM 20 . Bio3D-web puede ser ejecutado desde nuestro servidor en línea o instalado localmente en cualquier computadora que ejecute R. Bio3D-web está abierto a todos los usuarios y se ofrece de forma gratuita bajo una licencia de código abierto GPL-3 desde http: // thegrantlab. Org / bio3d / webapps
NOTA: Una sesión Bio3D-web típica continúa a través de cinco pasos consecutivos y dependientes (vea la Figura 1 para una representación esquemática). Cada paso se implementa como una pestaña de navegación consecutiva de la aplicación web es decir, SEARCH, ALIGN, FIT, PCA y eNMA.
1. Búsqueda y selección de estructuras (SEARCH)
2. Análisis de Alineación de Secuencias Múltiples (ALIGN)
3. Ajuste y análisis de la estructura (FIT)
4. Análisis de Componentes Principales (PCA)
5. Análisis de modo normal Ensemble (eNMA)
La adenilato quinasa (Adk) es una enzima ubicua que funciona para mantener el equilibrio entre los nucleótidos citoplásmicos esenciales para muchos procesos celulares. Adk opera catalizando la transferencia reversible de un grupo fosforilo de ATP a AMP. Esta reacción se acompaña de muy bien estudiado límite de la tasa de conformación transiciones [ 3 , 21] . Aquí analizamos todas las estructuras disponibles de Adk con Bio3D-web para revelar características detalladas y principios mecanísticos de estas transiciones esenciales.
Podemos comenzar nuestro análisis Bio3D-web de Adk ingresando el código PDB RCSB de cualquier estructura conocida de Adk. Por ejemplo, al ingresar la PDB ID 1AKE en el panel A de la pestaña SEARCH se devuelven 167 secuencias de estructuras similares a partir de las cuales se seleccionan automáticamente las 26 superiores para un análisis posterior (véase el panel B). La anotación presenteEd en el panel C indica que estas estructuras seleccionadas son todas de E. coli, se resolvieron mediante difracción de rayos X en un intervalo de grupos espaciales; Tienen un intervalo de resolución de 1,63 a 2,8 Å y se co-cristalizaron con un intervalo de ligandos diferentes (sin ligandos, AMP, ADP, MG y el inhibidor AP5). Tenga en cuenta que los detalles de anotación adicionales se pueden mostrar haciendo clic en la opción "Mostrar / ocultar columnas" en el panel C.
La alineación de secuencias múltiples se realiza al entrar en la pestaña ALIGN. El primer panel de la ficha ALIGN muestra un resumen de la alineación que proporciona detalles sobre el número de filas de secuencia (equivalente al número de estructuras PDB), así como el número de posiciones ( es decir, columnas de alineación). Esto incluye una especificación del número de columnas que contienen huecos y no huecos. La figura del lado derecho de la primera fila proporciona una representación esquemática de la alineación de secuencia. AquíE las áreas grises representan posiciones no-gap, mientras que las áreas blancas en la alineación corresponden a las brechas. Una representación de la conservación de la secuencia se muestra por encima de la alineación con las zonas rojas que indican las posiciones bien conservadas, y blanco que indica menos conservadas. Observe que las secuencias en esta figura se ordenan basándose en su similitud proporcionada por el dendrograma de agrupamiento en el lado izquierdo. El segundo panel de esta lengüeta facilita además el agrupamiento de los PDB seleccionados basándose en su similitud de secuencias en pares, que puede visualizarse bien como un dendrograma o como un mapa de calor. Por defecto, se muestra un dendrograma (o diagrama de árbol) que representa la disposición de los clústeres. El eje y del dendrograma representa la distancia (en términos de identidad de secuencia) entre los conglomerados.
La superposición de la estructura se realiza automáticamente al entrar en la pestaña FIT. Las estructuras superpuestas, presentadas interactivamente en el panel A, indicaTe la presencia de una región central relativamente rígida (que abarca los residuos 1-29, 68-117 y 161-214), vea el panel 'detalles opcionales del núcleo y detalles RMSD en la parte inferior de la lengüeta FIT para más detalles). También son claramente visibles dos regiones de unión a nucleótidos más variables (residuos 30-67 y 118-167) ( Figura 2 ). El agrupamiento basado en RMSD agrupa estas estructuras en dos conformaciones distintas.
Al hacer clic en la pestaña PCA se muestra más claramente la relación entre las estructuras en términos de los desplazamientos de estas regiones que cierran efectivamente sobre las especies de nucleótidos unidas en estructuras relacionadas ( Figura 2B y 2C ). La mayoría de las estructuras están en la forma "cerrada" (azul en la Figura 2C ) y están asociadas con un ligando o inhibidor unido. En contraste, las conformaciones más 'abiertas' son libres de nucleótidos y inhibidores. Esto es coherente conEl extenso cuerpo de investigación sobre la estructura y la dinámica de Adk indica que se requiere una configuración abierta de estas regiones para la unión de nucleótidos y una conformación cerrada para la transferencia eficiente de fosforilo y la supresión de eventos de hidrólisis perjudiciales. Es notable que una sola PC captura el 97% del desplazamiento cuadrático medio total en este conjunto de estructuras de Adk y proporciona una descripción clara y convincente de la transición abierta a cerrada junto con las contribuciones individuales de residuos a este desplazamiento funcional (panel C de la aplicación Y Figura 2 ).
La visita a la pestaña NMA y el aumento del número de estructuras consideradas para el cálculo (a través de la disminución del corte para filtrar estructuras similares) indica que las estructuras de estado abierto muestran dinámicas locales y globales mejoradas en comparación con las estructuras de forma cerrada ( Figura 2D y panel C de app) . Comparando resultados de PCA y NMA para(Panel D) indica que el primer modo de todas las estructuras de forma abierta muestra una superposición relativamente alta con PC1 (con un valor medio de 0,37 ± 0,04). Por el contrario, las estructuras de forma cerrada muestran valores más bajos (con una media de 0,30 ± 0,01). RMSIP valores para las estructuras de forma abierta (0,62 ± 0,003) son también más altos que los de estructuras cerradas (0,56 ± 0,008). Además, el análisis de superposición muestra que los primeros modos del estado abierto están en buen acuerdo con el cambio conformacional que describe la diferencia de los estados abierto y cerrado (panel E). El agrupamiento basado en valores RMSIP muestra de nuevo una partición consistente de estructuras de estado abierto y cerrado (panel F).
Colectivamente estos resultados indican la existencia de dos estados conformacionales distintos para Adk. Éstos difieren por un desplazamiento colectivo de baja frecuencia de dos regiones de sitio de unión a nucleótidos que muestran una flexibilidad distintaSobre la unión de nucleótidos.
Figura 1: Visión general de Bio3D-web con capturas de pantalla de las fichas PCA y NMA. Bio3D-web toma una estructura o secuencia de proteínas proporcionada por el usuario como entrada en la pestaña SEARCH ( 1 ). El servidor proporciona una lista de estructuras relacionadas, que se pueden seleccionar para un análisis posterior. ( 2 ) La pestaña ALIGN proporciona la alineación de secuencias y el análisis de las estructuras seleccionadas en la pestaña SEARCH. ( 3 ) En la pestaña FIT se superponen todas las estructuras y se visualizan en 3D junto con los resultados del análisis de estructura de pares convencional. ( 4 ) El análisis de componentes principales del conjunto de estructuras se realiza en la pestaña PCA para caracterizar las relaciones interconformidad. ( 5 ) El análisis de modo normal en cada estructura se puede llevar a cabo en la pestaña eNMAPara explorar tendencias dinámicas para los estados estructurales disponibles. Haga clic aquí para ver una versión más grande de esta figura.
Figura 2: Resultados del análisis Bio3D-web de adenilato quinasa. ( A ) Estructuras PDB disponibles de adenilato quinasa superpuestas sobre el núcleo invariante identificado. Las estructuras se colorean de acuerdo con el agrupamiento basado en RMSD proporcionado en la ficha FIT. ( B ) La visualización de los componentes principales está disponible en la pestaña PCA para caracterizar las principales variaciones conformacionales en el conjunto de datos. Aquí, la trayectoria correspondiente al primer componente principal se muestra en representación en tubo que muestra el movimiento de cierre a gran escala de la proteína. ( C ) Las estructuras son prOjetado sobre sus dos primeros componentes principales en un diagrama de conformer que muestra una representación de baja dimensión de la variabilidad conformacional. Cada punto (o estructura) se colorea según los criterios especificados por el usuario, en este caso los resultados de agrupación basados en PCA. ( D ) El análisis de modo normal en la pestaña eNMA sugiere dinámicas locales y globales mejoradas para estructuras en estado abierto (rojo) en comparación con las estructuras de forma cerrada (azul). Haga clic aquí para ver una versión más grande de esta figura.
Bio3D-web puede ser utilizado para explorar interactivamente y mapear los estados estructurales, dinámicos y funcionales de las proteínas de las estructuras cristalográficas disponibles. Además, los resultados de agrupación basados en NMA y PCA, junto con las anotaciones y el análisis basado en secuencias, pueden ser particularmente útiles para seleccionar estructuras representativas para análisis más largos tales como acoplamiento de moléculas pequeñas o simulaciones de dinámica molecular. Por lo tanto Bio3D-web facilita el análisis avanzado de la bioinformática estructural para un rango más amplio de investigadores al reducir el nivel requerido de experiencia técnica. El diseño actual de Bio3D-web enfatiza la simplicidad sobre la inclusión exhaustiva de los muchos métodos de análisis disponibles en el paquete completo Bio3D autónomo. En muchos casos se prevé que los investigadores utilizarán Bio3D-web para comprender las tendencias generales en su familia de proteínas o superfamilia de interés, lo que podría informar a más análisis especializados. Bio3D-web es elPor lo tanto, diseñados para explorar rápidamente conjuntos de datos de estructura biomolecular y actuar como una herramienta generadora de hipótesis. Animamos a los usuarios a seguir explorando sus datos proporcionando un ejemplo de código Bio3D en el informe reproducible que también almacena todos los detalles de la consulta y los resultados del análisis.
En el protocolo de ejemplo representativo anterior, mostramos la capacidad de Bio3D-web para revelar las características estructurales de las transiciones conformacionales funcionales de Adk. Las aplicaciones adicionales de Bio3D-web incluyen análisis estructural y dinámico de estructuras de PDB cargadas por usuarios. Por ejemplo, el usuario puede cargar nuevas estructuras o incluso secuencias de proteínas para su análisis. Los pasos de análisis mencionados anteriormente, especialmente el paso eNMA, pueden revelar las tendencias locales y globales en movimientos de proteínas, con movimientos colectivos de importancia funcional. La comparación con las estructuras de apo también puede revelar características de uniones no unidas a transiciones conformacionales unidas. Ejemplos adicionales de aplicación aUna gama de diferentes familias de proteínas se proporcionan en línea.
Aunque todas las proteínas son entidades flexibles y dinámicas, no todas las proteínas tienen estructuras de resolución atómica disponibles en una gama de estados diferentes ( por ejemplo, estados activos e inactivos). Nuestra visión del espacio de la estructura de proteínas es, por tanto, limitada y, por lo tanto, la percepción obtenida a partir de herramientas como Bio3D-web es necesariamente también limitada para ciertas proteínas. Sin embargo, con los avances tecnológicos actuales y las nuevas iniciativas para la genómica estructural, el protocolo presentado aquí se convertirá cada vez más en una ruta importante para conocer mejor las relaciones estructura-función. Un paso crítico, que es particularmente importante cuando se analizan proteínas más distantes, es la aparición potencial de errores de alineación en la pestaña ALIGN. Los errores de alineación inevitablemente se producirán cuando la similitud de secuencia cae por debajo del 30% y el usuario debe, en tales casos, verificar y corregir la alineación de secuenciaEn la pestaña ALINEAR. Los errores de alineación posiblemente resultarán en estructuras superpuestas incorrectas en la pestaña FIT y enmascararán las variaciones conformacionales más relevantes para el PCA subsiguiente. Además, el usuario debe ser consciente de los residuos que faltan en las estructuras de PDB seleccionadas, como en la implementación actual PCA sólo se puede realizar en residuos de proteínas en el que todas las estructuras tienen su correspondiente átomo de carbono alfa resuelto. En consecuencia, si un PDB seleccionado tiene residuos no resueltos para una región particular de la proteína, esta región se omitirá de PCA.
Bio3D-web se limita actualmente al análisis de estructuras de PDB de cadena única. En consecuencia, los movimientos funcionales que ocurren en el nivel cuaternario no pueden ser explorados usando el protocolo actual. Aunque actualmente estamos desarrollando nuevos algoritmos para incluir este tipo de análisis en Bio3D-web, la única opción actual es a través del uso convencional de Bio3D.
Bio3D-web es la única aplicación en líneaQue permite consultar e identificar conjuntos de estructuras, interpretar sus patrones de secuencia y variabilidad estructural y extraer información mecanicista tanto del análisis como de la predicción de su plasticidad estructural. Una amplia gama de herramientas de visualización molecular y servidores en línea permiten a los investigadores explorar y analizar estructuras biomoleculares individuales. Sin embargo, las herramientas existentes para el análisis de la secuencia, la estructura y la dinámica de las grandes familias heterogéneas de proteínas a menudo requieren conocimientos computacionales significativos y, por lo general, sólo son accesibles a los usuarios con habilidades de programación relevantes. Por ejemplo, el paquete Bio3D requiere R 8 , ProDy requiere python y Maven requiere conocimientos de Matlab 9 , 10 . Bio3D-web en contraste no requiere ningún conocimiento de programación y, por tanto, aumenta la accesibilidad y disminuye la barrera de entrada a la realización avanzada secuencia comparativa, estructura y dyAnálisis de la calidad. Además, la preparación, curación, anotación y limpieza de estructuras moleculares que es frecuentemente necesario para un análisis eficiente se incluye con el servicio Bio3D-web. Además, la restricción para realizar este análisis en recursos computacionales capaces se ve aliviada por nuestra instancia de servidor que permite el análisis a gran escala de muchas estructuras que pueden ser iniciadas y controladas desde cualquier navegador web moderno.
El desarrollo abierto de Bio3D-web está en curso (ver https://bitbucket.org/Grantlab/bio3d). Continuamos agregando nueva funcionalidad de análisis y mejorando los métodos existentes. El desarrollo futuro se centrará en la adición de PCA basada en la matriz de distancia y PCA torsional, enfoques de conservación de secuencias más extensos que incluyen un componente filogenético, identificación del sitio de unión del conjunto y nuevos enfoques para el análisis dinámico de redes entre familias de proteínas. A este respecto, la aplicación web actual representa el punto de partidaT para muchos otros flujos de trabajo de análisis bioinformático estructural colaborativo permitiendo pasos reproducibles y compartibles en conjuntos de estructura experimental definidos por el usuario. También planificamos el apoyo futuro de conjuntos de coordenadas de unidades biológicas reconstruidas además de cadenas individuales y múltiples de la unidad asimétrica de estructuras de PDB. Las características adicionales incluirán el ahorro y carga mejorados de espacios de trabajo colaborativos junto con una posibilidad de deshacer.
Bio3D-web es una aplicación en línea para el análisis interactivo de datos de estructura biomolecular. Bio3D-web se ejecuta en cualquier navegador Web moderno y proporciona funcionalidad para: (1) La identificación de conjuntos de estructuras de proteínas relacionadas con los umbrales de similitud especificados por el usuario; (2) Su superposición de alineación y estructura múltiple; (3) Análisis de la secuencia y la conservación de la estructura; (4) Cartografía de la relación interconformidad con el análisis del componente principal, y (5) comparación de la dinámica interna predicha a través del conjunto niAnálisis de modo malo. Esta funcionalidad integrada proporciona un flujo de trabajo completo para la investigación de relaciones estructura-secuencia-dinámica dentro de familias de proteínas y superfamilias. Además de una conveniente interfaz dinámica fácil de usar para explorar los efectos de las opciones de parámetros y métodos, Bio3D-web también registra la entrada completa del usuario y los resultados gráficos subsiguientes de la sesión de un usuario. Esto permite a los usuarios compartir y reproducir fácilmente la secuencia de pasos de análisis que crearon sus resultados. Bio3D-web se implementa completamente en el lenguaje R y se basa en los paquetes Bio3D y Shiny R. Puede ejecutarse desde nuestro servidor en línea o instalarse localmente en cualquier computadora que ejecute R. Esto incluye la instalación del servidor local para proporcionar una instancia multiusuario personalizada con acceso a conjuntos de datos estructurales prioritarios como los comunes en la industria farmacéutica. El código fuente completo y la extensa documentación se proporcionan bajo una licencia de código abierto GPL-3 de: http://thegrantlab.org/ Bio3d / webapps
Los autores declaran que no tienen intereses financieros en competencia.
Damos las gracias al Dr. Guido Scarabelli y Hongyang Li para las pruebas extensas durante el desarrollo, así como la comunidad de usuarios de Bio3D y los participantes del taller de bioinformática estructural de la Universidad de Bergen para comentarios y comentarios que han mejorado esta aplicación.
Name | Company | Catalog Number | Comments |
Bio3D-web | |||
Web-site | http://thegrantlab.org/bio3d-web/ | ||
Requirements | Web browser |
Solicitar permiso para reutilizar el texto o las figuras de este JoVE artículos
Solicitar permisoThis article has been published
Video Coming Soon
ACERCA DE JoVE
Copyright © 2025 MyJoVE Corporation. Todos los derechos reservados