Method Article
É apresentado um protocolo para a investigação on-line sobre a relação proteína-estrutura-dinâmica usando Bio3D-web.
Demonstamos o uso da Bio3D-web para análise interativa de dados de estrutura biomolecular. O aplicativo Bio3D-web oferece funcionalidade on-line para: (1) A identificação de conjuntos de estruturas protéicas relacionadas aos limites de similaridade especificados pelo usuário; (2) Seu alinhamento múltiplo e estrutura superposição; (3) Análise de conservação de seqüência e estrutura; (4) Mapeamento de relacionamento entre confórmeros com análise de componentes principais e (5) comparação de dinâmicas internas previstas através de análise de modo normal de conjunto. Essa funcionalidade integrada fornece um fluxo de trabalho completo em linha para investigar relacionamentos estrutura-estrutura-estrutura dentro de famílias de proteínas e superfamílias.
O banco de dados de proteína (PDB) agora contém mais de 120.000 estruturas de proteína - muitas das quais são da mesma família de proteínas, mas resolvidas em diferentes condições experimentais. Essas múltiplas estruturas representam um recurso inestimável para entender as complexidades da forma e função da proteína. Por exemplo, a comparação rigorosa desses conjuntos estruturais pode revelar importantes mecanismos moleculares 1 , 2 , 3 e informar sobre dinâmicas conformacionais envolvidas em processos, incluindo ligação de ligando, catálise enzimática e reconhecimento bi-molecular 4 , 5 , 6 , 7 . Novos insights podem ser obtidos com a análise detalhada em larga escala da sequência, estrutura e dinâmica das famílias de proteínas. No entanto, isso normalmente requer bioinfia considerávelConhecimentos de programação ormática e informática, juntamente com a familiaridade com os sistemas de proteínas em estudo. Por exemplo, pacotes de software como Bio3D, ProDy e Maven requerem programação em R, Python e Matlab, respectivamente 8 , 9 , 10 . Por outro lado, as ferramentas on-line para análise de flexibilidade estrutural são geralmente limitadas à investigação de estruturas individuais 11 , 12 . Uma excepção a este respeito é o servidor WebNM @ recentemente desenvolvido, que permite a comparação de padrões de flexibilidade obtidos da análise de modo normal (NMA) de várias estruturas pré-alinhadas especificadas pelo usuário 13 . No entanto, este servidor não possui um procedimento automatizado para a identificação de estruturas para comparação, seu alinhamento ou análise posterior além da NMA. Outra contribuição recente é o banco de dados PDBFlex on-line, que apresenta pré-cAnálise computorizada de estruturas PDB compartilhando identidade de sequência de 95% ou superior 14 . No entanto, a análise de conjuntos de estruturas mais diversas não está disponível no momento.
Nós já apresentamos o Bio3D-web - um aplicativo web fácil de usar para a análise das relações de estrutura-estrutura-estrutura-dinâmica 15 . O Bio3D-web é único no fornecimento de funcionalidade integrada fácil de usar para a identificação, comparação e análise detalhada de grandes conjuntos de estruturas homólogas online. Aqui apresentamos um protocolo detalhado para a investigação on-line da relação proteína-sequência-estrutura-dinâmica usando Bio3D-web. O Bio3D-web fornece uma variedade de funções para suportar os cinco principais passos da análise de dados mostrados na Figura 1 e discutidos em detalhes abaixo. Essas etapas constituem um fluxo de trabalho que abrange a seqüência de consulta ou a entrada da estrutura, através de vários níveis de análise de seqüência-estrutura-dinâmica, para resumirE geração de relatórios. Os resultados estão disponíveis imediatamente através de extensas aplicações de visualização e planejamento no navegador, bem como através do download de arquivos de resultados em formatos comumente usados. Além de uma interface dinâmica fácil de usar para explorar os efeitos das opções de parâmetros e métodos, a Bio3D-web também registra a entrada completa do usuário e os resultados gráficos subseqüentes da sessão de um usuário como um relatório reproduzível compartilhável em formatos PDF, DOC e HTML. As sessões do usuário podem ser salvas e recarregadas em tempos futuros e resultados completos baixados e interpretados pelo pacote Bio3D R na máquina local de um usuário.
A Bio3D-web é alimentada pelo pacote Bio3D R para análise de dados de simulação biológica, sequência e simulação biomolecular 8 , 16 . Em particular, algoritmos Bio3D para identificação de núcleo rígido 8 , superposição, análise de componentes principais(PCA) 8 e a análise de modo normal de conjunto (eNMA) 16 formam a base da aplicação. Também utilizamos protocolos Bio3D que dependem do pHMMER 17 para identificação de estruturas protéicas relacionadas e MUSCLE 18 para alinhamento de sequências múltiplas. As anotações de estrutura e sequência são derivadas através de utilitários Bio3D a partir dos bancos de dados RCSB PDB 19 e PFAM 20 . O Bio3D-web pode ser executado a partir de nosso servidor on-line ou instalado localmente em qualquer computador que esteja executando o R. Bio3D-web está aberto a todos os usuários e é fornecido gratuitamente sob uma licença de código aberto GPL-3 de: http: // thegrantlab. Org / bio3d / webapps
NOTA: Uma sessão típica da Bio3D-web passa por cinco etapas consecutivas e dependentes (veja a Figura 1 para uma representação esquemática). Cada etapa é implementada como uma guia de navegação consecutiva do aplicativo da Web, a saber, SEARCH, ALIGN, FIT, PCA e eNMA.
1. Pesquisa e seleção de estrutura (PESQUISA)
2. Análise de Alinhamento de Sequências Múltiplas (ALIGN)
3. Estrutura de montagem e análise (FIT)
4. Análise de componentes principais (PCA)
5. Ensemble Normal Mode Analysis (eNMA)
Adenylate kinase (Adk) é uma enzima ubíqua que funciona para manter o equilíbrio entre nucleotídeos citoplasmáticos essenciais para muitos processos celulares. O Adk opera catalisando a transferência reversível de um grupo fosforil de ATP para AMP. Essa reação é acompanhada por transições conformacionais limitantes de taxa bem estudadas 3 , 21 . Aqui, analisamos todas as estruturas Adk atualmente disponíveis com Bio3D-web para revelar características detalhadas e princípios mecanicistas dessas transições essenciais.
Podemos começar a análise Bio3D-web da Adk digitando o código RCSB PDB de qualquer estrutura Adk conhecida. Por exemplo, inserir o PDB ID 1AKE no painel A da guia SEARCH retorna 167 estruturas semelhantes a seqüências das quais os top 26 são selecionados automaticamente para análise posterior (veja o painel B). A anotação presenteEd no painel C indica que essas estruturas selecionadas são todas de E. coli, foram resolvidas por difração de raios X em uma gama de grupos espaciais; Têm uma gama de resolução de 1,63 a 2,8 Â e foram co-cristalizados com uma gama de diferentes ligandos (incluindo não ligandos, AMP, ADP, MG e o inibidor AP5). Observe que os detalhes de anotação adicionais podem ser exibidos clicando na opção "Mostrar / Ocultar Colunas" no painel C.
O alinhamento de seqüência múltipla é realizado ao entrar na guia ALIGN. O primeiro painel da guia ALIGN exibe um resumo do alinhamento que fornece detalhes sobre o número de linhas de seqüência (equivalente ao número de estruturas PDB), bem como o número de posições ( ou seja , colunas de alinhamento). Isso inclui uma especificação do número de colunas que não possuem espaços e lacunas. A figura no lado direito da primeira linha fornece uma representação esquemática do alinhamento da seqüência. Aqui thAs áreas cinzentas representam posições não gap, enquanto as áreas brancas no alinhamento correspondem a lacunas. Uma representação da conservação da sequência é mostrada acima do alinhamento com áreas vermelhas indicando posições bem conservadas e branco indicando menos conservado. Observe que as seqüências nesta figura são ordenadas com base em sua similaridade fornecida pelo dendrograma de agrupamento no lado esquerdo. O segundo painel desta guia facilita ainda o agrupamento dos PDBs selecionados com base em sua similaridade de seqüência em pares, que pode ser visualizado como um dendrograma ou um mapa de calor. Por padrão, é mostrado um dendrograma (ou diagrama de árvore) que representa a disposição dos clusters. O eixo y do dendrograma representa a distância (em termos de identidade de sequência) entre os clusters.
A superposição da estrutura é realizada automaticamente ao entrar na guia FIT. As estruturas sobrepostas, exibidas de forma interativa no painel A, indicaNa presença de uma região do núcleo relativamente rígida (abrangendo os resíduos 1-29, 68-117 e 161-214, veja o painel "detalhes do núcleo opcional e detalhes do RMSD" na parte inferior da guia FIT para obter detalhes). Duas outras regiões variáveis de ligação a nucleótidos (resíduos 30-67 e 118-167) também são claramente visíveis ( Figura 2 ). O agrupamento baseado em RMSD agrupa essas estruturas em duas conformações distintas.
Clicar na guia PCA mostra mais claramente a relação entre as estruturas em termos de deslocamentos dessas regiões que efetivamente se fecham sobre as espécies nucleotídicas ligadas em estruturas relacionadas ( Figura 2B e 2C ). A maioria das estruturas está na forma "fechada" (azul na Figura 2C ) e está associada a um ligando ou inibidor ligado. Em contraste, as conformações mais abertas são livres de inibidores de nucleótidos e inibidores. Isso é consistente comO vasto conjunto de pesquisas sobre a estrutura e a dinâmica de Adk, indicando que uma configuração aberta dessas regiões é necessária para a ligação de nucleotídeos e uma conformação fechada para transferência eficiente de fosforil e supressão de eventos de hidrólise prejudicial. É notável que um único PC capture 97% do deslocamento quadrático médio total neste conjunto de estruturas Adk e fornece uma descrição clara e convincente da transição aberta para fechada junto com as contribuições de resíduos individuais para esse deslocamento funcional (painel C do aplicativo E Figura 2 ).
A visita da guia NMA e o aumento do número de estruturas consideradas para o cálculo (através da redução do ponto de corte para filtragem de estruturas semelhantes) indicam que as estruturas de estado aberto exibem dinâmicas locais e globais aprimoradas em comparação com as estruturas de formas fechadas ( Figura 2D e painel C do aplicativo) . Comparando PCA e NMA resultados paraEstruturas individuais (painel D) indicam que o primeiro modo de todas as estruturas abertas exibe uma sobreposição relativamente alta para o PC1 (com um valor médio de 0,37 ± 0,04). Em contraste, as estruturas de formas fechadas apresentam valores mais baixos (com uma média de 0,30 ± 0,01). Os valores de RMSIP para estruturas abertas (0,62 ± 0,003) também são superiores aos de estruturas fechadas (0,56 ± 0,008). Além disso, a análise de sobreposição mostra que os primeiros modos do estado aberto estão de acordo com a mudança conformacional que descreve a diferença dos estados aberto e fechado (painel E). O agrupamento baseado em valores do RMSIP novamente exibe uma partição consistente de estruturas de estado aberto e fechado (painel F).
Coletivamente, esses resultados indicam a existência de dois estados conformacionais distintos para Adk. Estes diferem por um deslocamento coletivo de baixa freqüência de duas regiões do site de ligação a nucleótidos que exibem flexibi distintoLidades após a ligação de nucleótidos.
Figura 1: Visão geral da Bio3D-web com capturas de tela das guias PCA e NMA. A Bio3D-web possui uma estrutura ou seqüência de proteína fornecida pelo usuário como entrada na guia SEARCH ( 1 ). O servidor fornece uma lista de estruturas relacionadas, que podem ser selecionadas para análise posterior. ( 2 ) A guia ALIGN fornece alinhamento de seqüência e análise das estruturas selecionadas na guia SEARCH. ( 3 ) Na guia FIT, todas as estruturas são sobrepostas e visualizadas em 3D, juntamente com os resultados da análise convencional da estrutura par-wise. ( 4 ) A análise do componente principal do conjunto de estrutura é realizada na aba PCA para caracterizar as relações entre confeitárias. ( 5 ) A análise do modo normal em cada estrutura pode ser realizada na guia eNMAPara explorar tendências dinâmicas para os estados estruturais disponíveis. Clique aqui para ver uma versão maior dessa figura.
Figura 2: Resultados da análise Bio3D-web da adenilato quinase. ( A ) Estruturas PDB disponíveis de adenilato cinase sobrepostas no núcleo invariante identificado. As estruturas são coloridas de acordo com o agrupamento baseado em RMSD fornecido na guia FIT. ( B ) A visualização dos principais componentes está disponível na guia PCA para caracterizar as principais variações conformacionais no conjunto de dados. Aqui, a trajetória correspondente ao primeiro componente principal é mostrada na representação do tubo mostrando o movimento de fechamento em larga escala da proteína. ( C ) Estruturas são prOjected em seus dois primeiros componentes principais em um gráfico de conformer mostrando uma representação de baixa dimensão da variabilidade conformacional. Cada ponto (ou estrutura) é colorido de acordo com critérios especificados pelo usuário, neste caso, resultados de agrupamento baseados em PCA. ( D ) A análise de modo normal na guia eNMA sugere dinâmicas locais e globais aprimoradas para estruturas em aberto (vermelho) em comparação com as estruturas de forma fechada (azul). Clique aqui para ver uma versão maior dessa figura.
Bio3D-web pode ser usado para explorar e mapear os estados estruturais, dinâmicos e funcionais das proteínas das estruturas cristalográficas disponíveis. Além disso, os resultados de agrupamento baseados em NMA e PCA, juntamente com as anotações e análises baseadas em seqüências, podem ser particularmente úteis para selecionar estruturas representativas para análises mais demoradas, como simulações de pequena molécula de acoplamento ou dinâmica molecular. A Bio3D-web facilita análises de bioinformática estrutural avançada para uma gama mais ampla de pesquisadores, reduzindo o nível de conhecimento técnico exigido. O design atual da Bio3D-web enfatiza a simplicidade sobre a inclusão exaustiva dos muitos métodos de análise disponíveis no pacote Bio3D autônomo completo. Em muitos casos, prevê-se que os pesquisadores usem o Bio3D-web para entender as tendências gerais em sua família de proteínas ou superfamília de interesse, o que pode então informar análises mais especializadas. Bio3D-web é oAntes projetado para explorar rapidamente os conjuntos de dados da estrutura biomolécula e atuar como uma ferramenta geradora de hipóteses. Incentivamos os usuários a explorar seus dados fornecendo o exemplo de código Bio3D no relatório reprodutível que também armazena todos os detalhes da consulta e os resultados da análise.
No exemplo representativo do exemplo acima, mostramos a capacidade da Bio3D-web para revelar as características estruturais das transições conformacionais funcionais da Adk. Aplicações adicionais do Bio3D-web incluem análise estrutural e dinâmica de estruturas PDB carregadas pelo usuário. Por exemplo, o usuário pode enviar novas estruturas ou mesmo seqüências de proteínas para análise. As etapas de análise mencionadas anteriormente, especialmente o passo de eNMA, podem revelar tendências locais e globais em movimentos de proteínas, com movimentos coletivos de significância funcional. A comparação com estruturas de apo também pode revelar características de transições conformacionais não ligadas a encadernadas. Exemplos adicionais de aplicação paraUma variedade de diferentes famílias de proteínas são fornecidas online.
Embora todas as proteínas sejam entidades flexíveis e dinâmicas, nem todas as proteínas possuem estruturas de resolução atômica disponíveis em uma variedade de estados diferentes ( por exemplo, estados ativos e inativos). Nossa visão do espaço da estrutura protéica é, portanto, limitada e, portanto, a visão obtida de ferramentas como a Bio3D-web também é necessariamente limitada para certas proteínas. No entanto, com os avanços tecnológicos atuais e as novas iniciativas para a genômica estrutural, o protocolo aqui apresentado se tornará cada vez mais um caminho importante para obter informações sobre relacionamentos estrutura-função importantes. Um passo crítico, que é particularmente importante ao analisar proteínas mais distantes, é o potencial surgimento de erros de alinhamento na guia ALIGN. Os erros de alinhamento inevitavelmente ocorrerão quando a semelhança da sequência cair abaixo de 30% e o usuário deve, nesses casos, verificar e corrigir o alinhamento da sequênciaNa guia ALIGN. Erros de alinhamento, possivelmente, resultarão em estruturas superpostas impostas na guia FIT e mascararão as variações conformacionais mais relevantes para o PCA subsequente. Além disso, o usuário deve estar ciente dos resíduos em falta nas estruturas de PDB selecionadas, como na implementação atual PCA só pode ser realizada em resíduos de proteína em que todas as estruturas têm o seu átomo de carbono alfa correspondente resolvido. Conseqüentemente, se um PDB selecionado tiver resíduos não resolvidos para uma região específica da proteína, esta região será omitida da PCA.
O Bio3D-web atualmente está limitado à análise de estruturas de PDB de cadeia única. Consequentemente, os movimentos funcionais que ocorrem no nível quaternário não podem ser explorados usando o protocolo atual. Embora atualmente estejamos desenvolvendo novos algoritmos para incluir essa análise no Bio3D-web, a única opção atual é através do uso convencional de Bio3D.
Bio3D-web é o único aplicativo onlineQue permite pesquisar e identificar conjuntos de estruturas, interpretar seus padrões de seqüência e variabilidade estrutural e extrair informações mecanicistas tanto da análise quanto da predição de sua plasticidade estrutural. Uma ampla gama de ferramentas de visualização molecular e servidores on-line permitem aos pesquisadores explorar e analisar estruturas biomoleculares individuais. No entanto, as ferramentas existentes para análise da seqüência, estrutura e dinâmica de grandes famílias de proteínas heterogêneas muitas vezes requerem conhecimentos computacionais significativos e, tipicamente, permanecem acessíveis apenas para usuários com habilidades de programação relevantes. Por exemplo, o pacote Bio3D requer R 8 , o ProDy requer python e Maven requer conhecimento 9 , 10 de Matlab. A Bio3D-web, em contraste, não requer conhecimento de programação e, assim, aumenta a acessibilidade e diminui a barreira de entrada para realizar uma seqüência comparativa avançada, estrutura e dyAnálise de namics. Além disso, a preparação, a cura, a anotação e a limpeza das estruturas moleculares que são freqüentemente necessárias para análises eficientes estão incluídas no serviço web Bio3D. Além disso, a restrição para realizar essa análise em recursos computacionais capazes é aliviada por nossa instância de servidor que permite a análise em grande escala de muitas estruturas que podem ser iniciadas e controladas a partir de qualquer navegador web moderno.
O desenvolvimento aberto do Bio3D-web está em andamento (consulte https://bitbucket.org/Grantlab/bio3d). Continuamos a adicionar novas funcionalidades de análise e a melhorar os métodos existentes. O desenvolvimento futuro incidirá na adição de PCA baseado em matriz de distância e PCA torsional, abordagens de conservação de seqüência mais extensas que incluam um componente filogenético, identificação de local de ligação de conjunto e novas abordagens para análise de rede dinâmica em famílias de proteínas. A este respeito, a aplicação web atual representa o ponto inicialT para muitos outros fluxos de trabalho de análise de bioinformática estrutural colaborativa, permitindo etapas reproduzíveis e compartilháveis em conjuntos de estrutura experimental definidos pelo usuário. Também planejamos o suporte futuro de conjuntos de coordenadas de unidades biológicas reconstruídas, além de cadeias individuais e múltiplas da unidade assimétrica de estruturas PDB. Recursos adicionais incluirão poupança e carregamento aprimorados de espaços de trabalho colaborativos, juntamente com uma possibilidade de desfazer.
Bio3D-web é um aplicativo on-line para análise interativa de dados de estrutura biomolecular. O Bio3D-web é executado em qualquer navegador da Web moderno e fornece funcionalidade para: (1) A identificação de conjuntos de estrutura de proteína relacionados aos limites específicos de similaridade do usuário; (2) Seu alinhamento múltiplo e estrutura superposição; (3) Análise de conservação de seqüência e estrutura; (4) Mapeamento de relacionamento entre confórmeros com análise de componente principal, e (5) comparação de dinâmicas internas previstas por conjunto nemAnálise de modo mal. Esta funcionalidade integrada fornece um fluxo de trabalho completo para a investigação de relacionamentos estrutura-estrutura-sequência dentro de famílias de proteínas e superfamílias. Além de uma interface dinâmica fácil de usar para explorar os efeitos das opções de parâmetros e métodos, o Bio3D-web também grava a entrada completa do usuário e os resultados gráficos subsequentes da sessão de um usuário. Isso permite aos usuários compartilhar e reproduzir facilmente a seqüência de etapas de análise que criaram seus resultados. O Bio3D-web é implementado inteiramente no idioma R e é baseado nos pacotes Bio3D e Shiny R. Pode ser executado a partir do nosso servidor on-line ou instalado localmente em qualquer computador rodando R. Isso inclui a instalação do servidor local para fornecer uma instância multiusuficiente personalizada com acesso a conjuntos de dados estruturais prioritários, como os comuns na indústria farmacêutica. O código fonte completo ea extensa documentação são fornecidos sob uma licença de código aberto GPL-3 de: http://thegrantlab.org/ Bio3d / webapps
Os autores declaram que não têm interesses financeiros concorrentes.
Agradecemos ao Dr. Guido Scarabelli e Hongyang Li por testes extensivos ao longo do desenvolvimento, bem como a comunidade de usuários Bio3D e os participantes da oficina de bioinformática estrutural da Universidade de Bergen para comentários e comentários que melhoraram esta aplicação.
Name | Company | Catalog Number | Comments |
Bio3D-web | |||
Web-site | http://thegrantlab.org/bio3d-web/ | ||
Requirements | Web browser |
Solicitar permissão para reutilizar o texto ou figuras deste artigo JoVE
Solicitar PermissãoThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Todos os direitos reservados