Method Article
La base de données ITS2 est un atelier pour la séquence d'inférence phylogénétique considérant simultanément et de la structure secondaire de l'espaceur interne transcrit 2. Cela comprend la collecte de données avec l'annotation précise, prédiction de la structure, plusieurs séquence-structure d'alignement et de calcul d'arbre rapide. En un mot, ce plan de travail simplifie les analyses phylogénétiques premiers à quelques clics.
Le espaceur interne transcrit 2 (ITS2) a été utilisée comme un marqueur phylogénétique pour plus de deux décennies. Comme ITS2 de recherche principalement axée sur la séquence ITS2 très variable, il a limité ce marqueur à faible niveau phylogénétique seulement. Toutefois, la combinaison de la séquence ITS2 et sa structure hautement conservée secondaire améliore la résolution phylogénétique 1 et permet à l'inférence phylogénétique rangs taxonomiques multiples, y compris la délimitation espèces 2-8.
La base de données ITS2 9 présente un ensemble de données exhaustive des entretoises internes transcrits 2 séquences du NCBI GenBank 11 précision reannotated 10. Après une annotation par des modèles de profil Markov Cachés (MMC), la structure secondaire de chaque séquence est prédit. Tout d'abord, on teste si un minimum d'énergie en fonction de pliage 12 (direct fois) les résultats d'une manière correcte, la conformation de quatre hélices. Si ce n'est pas le cas, la structure estprédit par 13 modélisation par homologie. Dans la modélisation par homologie, une structure déjà connue secondaire est transféré à une autre séquence ITS2, dont la structure secondaire n'était pas en mesure de se replier correctement dans un pli directe.
La base de données ITS2 n'est pas seulement une base de données pour le stockage et la récupération de la séquence ITS2-structures. Il fournit également plusieurs outils pour traiter vos propres séquences ITS2, y compris l'annotation, la prédiction de structure, de détection motif et BLAST recherche 14 sur le combiné séquence-structure de l'information. En outre, il intègre les versions garnis de 4sale 15,16 et 17 pour le calcul ProfDistS alignement multiple séquence-structure et de neighbor joining 18 reconstruction d'arbres. Ensemble, ils forment un pipeline analyse cohérente à partir d'un ensemble initial de séquences d'une phylogénie sur la base de la séquence et la structure secondaire.
En un mot, ce plan de travail simplifie les analyses phylogénétiques premiers à seulementquelques-uns des clics de souris, tout en en outre fournir des outils et de données complètes pour analyses à grande échelle.
1. Annotation correcte de la séquence ITS2
2. Prédiction de structure secondaire
3. Recherche Motif
4. Rechercher et explorer les
5. ITS2 souffle
6. Multiple séquence-structure d'alignement
7. Arbre phylogénétique
8. Logiciels supplémentaires
9. Les résultats représentatifs
Le flux de travail tel que décrit ci-dessus a été appliquée avec succès dans plusieurs enquêtes en libre accès 3,4. Des exemples peuvent être vues à travers les liens suivants:
Dans ces études à grande échelle, nous étions en mesure de résoudre la phylogénie des Chlorophyta ainsi que Hypnales (Bryophytes) wvec une grande résolution. Dans les deux cas, un échantillonnage exhaustif taxon ont été recueillies à partir de la base de données ITS2 9, automatiquement aligné avec 4sale 15,16 et enfin traitées par ProfDistS 17 dans un arbre phylogénétique. Dans toutes ces étapes, la séquence et la structure des informations ont été utilisées simultanément. Soutien Bootstrap pour l'épine dorsale phylogénétique a été réalisée en utilisant voisin profil de jonction (PNJ) 19, qui est disponible dans la version stand-alone de ProfDistS.
Pour un plus petit ensemble de la séquence-structure paires, les chiffres 1 à 3 décrivent les étapes clés de ce flux de travail automatisé 5 directement sur le nouveau plan de travail ITS2 Base de données: échantillonnage taxon, le multiple séquence-structure d'alignement et, éventuellement, le calcul arbre phylogénétique.
Figure 1. Taxon échantillonnage par drag and drop. À toutes les séquences temporelles ou séquence-structur paires e peut être ajouté à la piscine de données, par exemple par glisser-déposer. Voici une séquence-structure est ajouté à l'aide de glisser-déposer après la prédiction de structure secondaire. Le ellipse bleue marque la zone où la séquence-structure est tombé dans le pool de données. Cliquez ici pour voir la version pleine grandeur de cette image.
Figure 2. Multiple séquence-structure d'alignement en mode graphique intégral. Pour les quelques séquences dans le pool de données, le mode le graphique a été choisi. Les bases sont de couleur; paires de bases peuvent être mis en évidence avec des cercles rouges en cliquant sur une base ou un support d'une paire de bases. Cliquez ici pour voir la version pleine grandeur de cette image.
3.jpg "alt =" Figure 3 "/>
Figure 3. Séquence-structure neighbor joining arbre. L'arbre évolutif librement calculée d'un sept taxons multiples séquence-structure d'alignement peuvent être sauvegardés dans le format Newick.
La base de données ITS2 est un atelier complet et pleinement fonctionnel pour internes transcrits d'écartement 2 séquence-structure-base phylogénétique. Le site web peut être utilisé très rapidement et intuitivement. Alors que d'autres établis phylogénie basés sur le Web comme ARB 20 ou 21 sont Mobyle seulement en mesure de travailler sur la séquence et / ou information sur la structure consensus, la base de données ITS2 9 estime séquences individuelles et les structures secondaires pour chaque taxon simultanément. Toutefois, en raison des limitations de la capacité de calcul du serveur web, il est fortement recommandé d'utiliser les outils autonomes pour l'alignement multiple et neighbor joining 18 calcul, 4sale 15,16 et 17 ProfDistS, respectivement, pour grands ensembles de données. A côté de la base de workflow ITS2 phylogénie séquence-structure 5, ces outils disposent de plusieurs fonctions supplémentaires, comme le calcul de bootstrap, voisin profil de jonction (PNJ) 19 ou d'espècesdélimitation est basé sur les changements de base compensatoires (CBCS) 8. Ils peuvent être accédés par l'intermédiaire du "A propos de ce site web" - section «Outils» pour le téléchargement et des informations détaillées. Pour utiliser 4sale et ProfDistS, il est nécessaire de toujours ramener les fichiers dans le format correct. Un taxon d'échantillonnage doit être traitée par 4sale doit avoir la fin. Fasta ou. Txt, alors que l'alignement de séquence-structure comme une entrée pour ProfDistS doit se terminer par. Xfasta.
Nous sommes actuellement à la mise en œuvre des méthodes alternatives pour la reconstruction arbre phylogénétique dans la base de données ITS2 ainsi que dans les outils connexes. Ainsi, des méthodes telles que la séquence-structure-based Maximum Parcimonie 22 et / ou maximum de vraisemblance 23 sera accessible à l'avenir.
Pas de conflits d'intérêt déclarés.
Nous remercie cordialement le groupe ITS2, Biocenter, Université de Würzburg, pour la rétroaction riche et précieuse. Nous remercions également la Deutsche Forschungsgemeinschaft (DFG; subvention Mu-2831/1-1) pour le financement.
Name | Company | Catalog Number | Comments |
Nom du réactif | Entreprise | Commentaires | |
Accès Internet | De préférence à grande vitesse | ||
ITS2 base de données 9 | Département de Bioinformatique, Université de Würzburg | Site Web: http://its2.bioapps.biozentrum.uni-wuerzburg.de | |
Logiciel: 4sale 15,16 | Département de Bioinformatique, Université de Würzburg | Télécharger: http://4sale.bioapps.biozentrum.uni-wuerzburg.de/ | |
Logiciel: ProfDistS 17 | Département de Bioinformatique, Université de Würzburg | Télécharger:Ni-wuerzburg.de / "target =" _blank "> http://profdist.bioapps.biozentrum.uni-wuerzburg.de/ |
Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE
Demande d’autorisationThis article has been published
Video Coming Soon