Method Article
Il database ITS2 è un banco di lavoro per la sequenza di inferenza filogenetica simultaneamente e considerando la struttura secondaria del spaziatore interno trascritto 2. Ciò include la raccolta di dati con annotazioni accurate, predizione della struttura, di sequenze multiple-struttura di allineamento e di calcolo albero veloce. In poche parole, questo banco di lavoro semplifica analisi filogenetiche primi pochi click.
Lo spaziatore interno trascritto 2 (ITS2) è stato utilizzato come marcatore filogenetica per più di due decenni. Come ITS2 ricerca principalmente focalizzata sulla sequenza ITS2 molto variabile, ha limitato questo indicatore a basso livello solo filogenesi. Tuttavia, la combinazione della sequenza ITS2 e la sua struttura altamente conservata secondaria migliora la risoluzione filogenetica 1 e permette inferenza filogenetica a ranghi tassonomici multipli, comprese le specie delimitazione 2-8.
Il ITS2 Database 9 presenta un set di dati esaustiva di interni trascritti distanziali 2 sequenze da NCBI GenBank 11 precisione reannotated 10. A seguito di un'annotazione profilo Models Hidden Markov (HMM), la struttura secondaria di ciascuna sequenza è previsto. In primo luogo, viene testato se un minimo di energia basata volte 12 (diretta volte) i risultati in una corretta, conformazione elica quattro. Se questo non è il caso, la struttura èprevisto dalla modellazione omologia 13. Nella modellazione omologia, una struttura già noto secondaria viene trasferita ad un'altra sequenza ITS2, la cui struttura secondaria non era in grado di piegare correttamente in una piega diretta.
Il database ITS2 non è solo un database per l'archiviazione e il recupero di ITS2 sequenza-strutture. Inoltre fornisce diversi strumenti per elaborare le proprie ITS2 sequenze, tra cui l'annotazione, la previsione strutturale, individuazione dei motivi e BLAST 14 ricerca sul combinato sequenza-struttura informativa. Inoltre, integra le versioni tagliate di 4SALE ProfDistS 15,16 e 17 per sequenze multiple-struttura calcolo di allineamento e Neighbor Joining 18 ricostruzione albero. Insieme formano un pipeline coerente analisi da una prima serie di sequenze di una filogenia basata sulla sequenza e struttura secondaria.
In poche parole, questo banco di lavoro semplifica analisi filogenetiche primi solopochi clic del mouse, mentre fornisce inoltre strumenti e dati completi per analisi su vasta scala.
1. Annotazione corretta di Sequence ITS2
2. Structure Prediction secondaria
3. Motif Search
4. Cerca e Consulta
5. ITS2 Blast
6. Sequenze multiple-struttura di allineamento
7. Albero filogenetico
8. Software aggiuntivo
9. Risultati rappresentativi
Il flusso di lavoro come descritto sopra è stata applicata con successo in una serie di indagini ad accesso aperto 3,4. Gli esempi possono essere visti attraverso i seguenti link:
In questi studi su larga scala, siamo stati in grado di risolvere la filogenesi di Chlorophyta così come Hypnales (Bryophyta) wesimo alta risoluzione. In entrambi i casi, un campionamento taxon esaustivo è stato raccolto dal Database ITS2 9, automaticamente allineato con 4SALE 15,16 e infine trattati da ProfDistS 17 in un albero filogenetico. In tutti questi passaggi, la sequenza e le informazioni della struttura sono stati utilizzati contemporaneamente. Bootstrap sostegno per la spina dorsale filogenetica è stata ottenuta utilizzando prossimo Profilo di giunzione (PNJ) 19, che è disponibile in versione stand-alone di ProfDistS.
Per un insieme ridotto di sequenza-struttura coppie, figure da 1 a 3 descritte le fasi principali di questo flusso di lavoro automatizzato 5 direttamente sul nuovo ITS2 workbench Database: campionamento taxon, il multiplo di sequenza-struttura di allineamento e, infine, il calcolo albero filogenetico.
Figura 1. Taxon di campionamento per il drag and drop. In tutte le sequenze temporali o sequenza di strut- coppie di e può essere aggiunto al pool di dati, ad esempio tramite drag and drop. Qui una sequenza-struttura viene aggiunto utilizzando il drag and drop dopo la predizione di struttura secondaria. L'azzurro segna ellisse l'area in cui è caduto la sequenza-struttura nel pool di dati. Clicca qui per vedere la versione full-size di questa immagine.
Figura 2. Multipla sequenza-struttura di allineamento in modalità completamente grafica. Per le sequenze pochi nel pool di dati, la modalità di un elemento grafico è stato scelto. Le basi sono colorati; coppie di basi può essere evidenziato con cerchi rossi cliccando su una base o staffa di una coppia di basi. Clicca qui per vedere la versione full-size di questa immagine.
3.jpg "alt =" Figura 3 "/>
Figura 3. Sequenza-struttura di Neighbor Joining albero. L'albero liberamente scalabile calcolato di un taxa sette sequenze multiple-struttura di allineamento possono essere salvati nel formato NEWICK.
Il Database ITS2 è un banco di lavoro completo e pienamente funzionale per interni trascritti spacer 2 sequenza-struttura-base di filogenesi. Il sito web può essere utilizzato molto veloce e intuitivo. Mentre gli altri web-based banchi filogenesi come ARB Mobyle 20 o 21 sono solo in grado di lavorare su sequenza e / o struttura informativa consenso, il ITS2 Database 9 considera le singole sequenze e strutture secondarie per ogni taxon simultaneamente. Tuttavia, a causa delle limitazioni nella capacità di calcolo del server web, si raccomanda di utilizzare gli strumenti stand-alone per l'allineamento multiplo e Neighbor Joining 18 calcolo, 4SALE ProfDistS 15,16 e 17, rispettivamente, per grandi dataset. Accanto alla base ITS2 sequenza-struttura del flusso di lavoro filogenesi 5, questi strumenti dispongono di numerose funzioni aggiuntive, come il calcolo bootstrap replica, Neighbor Joining Profile (PNJ) 19 o speciedelimitazione s sulla base delle variazioni compensative di base (CBC) 8. È possibile accedere attraverso la "Informazioni su questo sito" - sezione "Tools" per il download e informazioni dettagliate. Per utilizzare 4SALE e ProfDistS, è necessario portare sempre con file nel formato corretto. Un taxon campionamento per essere trattati da 4SALE deve avere il finale. Fasta o. Txt, mentre la sequenza-struttura di allineamento come input per ProfDistS deve terminare con. Xfasta.
Si stanno applicando metodi alternativi per la ricostruzione albero filogenetico nel database ITS2 nonché nei relativi strumenti. Così, metodi come la sequenza-struttura-based massima parsimonia 22 e / o Maximum Likelihood 23 sarà accessibile in futuro.
Non ci sono conflitti di interesse dichiarati.
Siamo lieti di ringraziare il gruppo ITS2, Biocenter, Università di Würzburg, per il feedback ricca e preziosa. Ringraziamo anche la Deutsche Forschungsgemeinschaft (DFG; sovvenzione Mu-2831/1-1) per il finanziamento.
Name | Company | Catalog Number | Comments |
Nome del reattivo | Azienda | Comments | |
Accesso ad Internet | Preferibilmente ad alta velocità | ||
ITS2 Database 9 | Dipartimento di Bioinformatica, Università di Würzburg | Sito web: http://its2.bioapps.biozentrum.uni-wuerzburg.de | |
Software: 4SALE 15,16 | Dipartimento di Bioinformatica, Università di Würzburg | Download: http://4sale.bioapps.biozentrum.uni-wuerzburg.de/ | |
Software: ProfDistS 17 | Dipartimento di Bioinformatica, Università di Würzburg | Download:ni-wuerzburg.de "target =" / _blank "> http://profdist.bioapps.biozentrum.uni-wuerzburg.de/ |
Richiedi autorizzazione per utilizzare il testo o le figure di questo articolo JoVE
Richiedi AutorizzazioneThis article has been published
Video Coming Soon