Method Article
O Banco de Dados ITS2 é uma seqüência de bancada para inferência filogenética e, simultaneamente, considerando a estrutura secundária do espaçador interno transcrito 2. Isto inclui a coleta de dados com anotações precisas, a previsão de estrutura, alinhamento de sequências-estrutura múltipla e cálculo árvore rápido. Em poucas palavras, esse ambiente de trabalho simplifica análises filogenéticas primeiros a alguns cliques.
O espaçador interno transcrito 2 (ITS2) tem sido utilizado como um marcador filogenética para mais de duas décadas. Como ITS2 pesquisa voltada principalmente para a seqüência ITS2 muito variável, confinado este marcador de baixo nível filogenética apenas. No entanto, a combinação da sequência ITS2 ea sua estrutura altamente conservada secundário melhora a resolução filogenética 1 e permite inferência filogenética em fileiras múltiplas taxonómicos, incluindo espécies de delimitação 2-8.
O Banco de Dados ITS2 9 apresenta um conjunto de dados exaustivo de espaçadores internos transcritos 2 seqüências do NCBI GenBank 11 precisão reannotated 10. Após uma anotação por Modelos Hidden Markov perfil (HMMs), a estrutura secundária de cada sequência é previsto. Primeiro, ele é testado se um mínimo de energia com base vezes 12 (vezes direta) resulta em uma correta conformação hélice, quatro. Se este não for o caso, a estrutura épredita por modelagem homologia 13. Em modelagem de homologia, uma estrutura já conhecida secundário é transferido para outra sequência de ITS2, cuja estrutura secundária não foi capaz de dobrar correctamente numa dobra directa.
O Banco de Dados ITS2 não é apenas um banco de dados para armazenamento e recuperação de ITS2 seqüência-estruturas. Ele também fornece várias ferramentas para processar as suas próprias sequências de ITS2, incluindo previsão, anotação estrutural, detecção e motivo de pesquisa BLAST 14 no combinadas informações de seqüência-estrutura. Além disso, integra as versões cortadas dos 4SALE 15,16 e ProfDistS 17 para cálculo alinhamento múltiplo de seqüência-estrutura e vizinho Unindo 18 reconstrução da árvore. Juntos, eles formam um gasoduto análise coerente de um conjunto inicial de seqüências de uma filogenia baseada na seqüência e estrutura secundária.
Em poucas palavras, esse ambiente de trabalho simplifica análises filogenéticas primeiros a apenasalguns cliques do mouse, enquanto que, adicionalmente, fornecendo ferramentas e dados para abrangentes análises em larga escala.
1. Anotação correta de ITS2 Sequence
2. Previsão de Estrutura Secundária
3. Pesquisa Motif
4. Pesquise e navegue
5. Explosão ITS2
6. Alinhamento de seqüências-estrutura múltipla
7. Árvore filogenética
8. Software adicional
9. Os resultados representativos
O fluxo de trabalho, como descrito acima foi utilizada com sucesso em vários inquéritos de acesso aberto 3,4. Exemplos podem ser vistos através dos seguintes links:
Nestes estudos de grande escala, nós fomos capazes de resolver a filogenia de Chlorophyta, bem como Hypnales (Bryophyta) wom alta resolução. Em ambos os casos, uma amostragem taxon exaustiva foi recolhida a partir do banco de dados ITS2 9, automaticamente alinhado com 4SALE 15,16 e finalmente processada por ProfDistS 17 em uma árvore filogenética. Em todos estes passos, a sequência e estrutura de informação foram utilizados simultaneamente. Suporte Bootstrap para a espinha dorsal filogenética foi conseguida utilizando Vizinho perfil de união (PNJ) 19, que está disponível na versão autónoma do ProfDistS.
Para um conjunto menor de seqüência-estrutura pares, figuras 1 a 3 descrevem os principais passos deste fluxo de trabalho automatizado 5 diretamente na bancada banco de dados novo ITS2: amostragem taxonômica, o alinhamento da seqüência de estrutura de múltiplas e, eventualmente, o cálculo árvore filogenética.
Figura 1. Amostragem Taxon por arrastar e soltar. Em qualquer seqüência de tempo ou seqüência estru- pares de e podem ser adicionados ao conjunto de dados, por exemplo através de arrastar e gota. Aqui uma sequência-estrutura é adicionado usando a função arrastar e soltar depois de predição de estrutura secundária. A elipse azul marca a área onde a seqüência de estrutura é jogada na piscina de dados. Clique aqui para ver a versão completa do tamanho desta imagem.
Figura 2. Alinhamento da seqüência-estrutura múltipla no modo gráfico completo. Para as sequências de poucos no conjunto de dados, o modo completo gráfico foi escolhido. Bases são coloridos; pares de bases podem ser destacados com círculos vermelhos clicando em uma base ou suporte de um par de base. Clique aqui para ver a versão completa do tamanho desta imagem.
"Alt =" 3.jpg Figura 3 "/>
Figura 3. Vizinho Sequence-estrutura Juntando árvore. A árvore livremente escalável calculado de sete táxons alinhamento da seqüência de estrutura de múltiplas podem ser salvos no formato Newick.
O Banco de Dados ITS2 é uma bancada completa e totalmente funcional para espaçadores internos transcritos 2 seqüência-estrutura-base filogenética. O site pode ser operado muito rápida e intuitiva. Enquanto outras bancadas baseados na web como filogenia ARB 20 ou 21 Mobyle só são capazes de trabalhar em seqüência e / ou informação sobre a estrutura de consenso, o banco de dados ITS2 9 considera seqüências e estruturas secundárias individuais para cada taxon simultaneamente. No entanto, devido a limitações na capacidade computacional do servidor web, é altamente recomendável usar as ferramentas stand-alone para alinhamento múltiplo e Neighbor Unindo 18 cálculo, 4SALE 15,16 e ProfDistS 17, respectivamente, para grandes conjuntos de dados. Além do básico de fluxo de trabalho filogenia ITS2 sequência estrutura-5, essas ferramentas apresentam várias funções adicionais, como calcular bootstrap repetições, vizinho Perfil Unir (PNJ) 19 ou espéciedelimitação s com base nas alterações de base de compensação (CBCS) 8. Eles podem ser acessados através do "Sobre este site" - seção "Ferramentas" para download e informações mais detalhadas. Para usar 4SALE e ProfDistS, é necessário sempre trazer os arquivos para o formato correto. Um táxon de amostragem para serem processados pelo 4SALE deve ter o final. Fasta ou. Txt, enquanto que o alinhamento da seqüência-estrutura como uma entrada para ProfDistS deve terminar com. Xfasta.
Estamos presentemente a implementação métodos alternativos para reconstrução filogenética árvore no banco de dados ITS2, bem como nas ferramentas relacionadas. Assim, métodos como seqüência-estrutura baseada em Máxima Parcimônia 22 e / ou máxima verossimilhança 23 estarão acessíveis no futuro.
Não há conflitos de interesse declarados.
Nós cordialmente agradecer ao grupo ITS2, centro biológico, da Universidade de Würzburg, para o feedback rico e valioso. Agradecemos também o Deutsche Forschungsgemeinschaft (DFG; concessão Mu-2831/1-1) para financiamento.
Name | Company | Catalog Number | Comments |
Nome do reagente | Companhia | Comentários | |
Acesso à Internet | De preferência, de alta velocidade | ||
ITS2 banco de dados 9 | Departamento de Bioinformática da Universidade de Würzburg | Website: http://its2.bioapps.biozentrum.uni-wuerzburg.de | |
Software: 4SALE 15,16 | Departamento de Bioinformática da Universidade de Würzburg | Download: http://4sale.bioapps.biozentrum.uni-wuerzburg.de/ | |
Software: ProfDistS 17 | Departamento de Bioinformática da Universidade de Würzburg | Download:ni-wuerzburg.de / "target =" _blank "> http://profdist.bioapps.biozentrum.uni-wuerzburg.de/ |
Solicitar permissão para reutilizar o texto ou figuras deste artigo JoVE
Solicitar PermissãoThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Todos os direitos reservados