JoVE Logo

Anmelden

Zum Anzeigen dieser Inhalte ist ein JoVE-Abonnement erforderlich. Melden Sie sich an oder starten Sie Ihre kostenlose Testversion.

In diesem Artikel

  • Zusammenfassung
  • Zusammenfassung
  • Einleitung
  • Protokoll
  • Ergebnisse
  • Diskussion
  • Offenlegungen
  • Danksagungen
  • Materialien
  • Referenzen
  • Nachdrucke und Genehmigungen

Zusammenfassung

Hier beschreiben wir eine Schritt-für-Schritt-Pipeline zum Erzeugen von zuverlässigen Phylogenien von Nukleotid-oder Aminosäuresequenz Datensätze. Dieser Leitfaden soll den Forschern oder Studenten neue phylogenetische Analyse dienen.

Zusammenfassung

Viele Forscher, auf unglaublich vielfältige Schwerpunkte sind die Anwendung phylogenetics, ihre Forschungs Frage (n). Allerdings sind viele Forscher neu in diesem Thema und so präsentiert sie inhärente Probleme. Hier erstellen wir eine praktische Einführung in phylogenetics für Nichtexperten. Wir skizzieren in einer Schritt-für-Schritt-Weise, eine Pipeline für die Erzeugung zuverlässiger Phylogenien Gensequenz von Datensätzen. Wir beginnen mit einem Benutzer-Leitfaden für Ähnlichkeitssuche über Online-Tools, Schnittstellen sowie lokale ausführbare Dateien. Weiter, wir Programme zur Erzeugung von multiplen Sequenz-Alignments, gefolgt von Protokollen für die Verwendung von Software, um Best-Fit-Modelle der Evolution bestimmen, zu erkunden. Wir skizzieren dann Protokolle für die Rekonstruktion phylogenetischen Beziehungen über Maximum-Likelihood-und Bayes-Kriterien zu beschreiben und schließlich Werkzeuge zur Visualisierung von Stammbäumen. Zwar ist dies keineswegs eine erschöpfende Beschreibung der phylogenetischen Ansätze, tut es dem Leser praktische Start informatIonen auf die wichtigsten Software-Anwendungen häufig von phylogeneticists genutzt. Die Vision für diesen Artikel wäre, dass es könnte als praktisches Trainingsgerät für Forscher sie sich auf phylogenetische Studien dienen und dienen auch als pädagogische Ressource, die in einem Klassenzimmer oder Lehrlabor aufgenommen werden könnte.

Einleitung

Um zu verstehen, wie sich zwei (oder mehr) Spezies entwickelt, ist es zunächst erforderlich, Sequenz oder morphologische Daten von jeder Probe zu erhalten, diese Daten darstellen Mengen, die wir nutzen können, um ihre Beziehung durch evolutionäre Raum zu messen. Genau wie bei der Messung der Luftlinie, mit mehr Daten zur Verfügung (z. B. Meilen, Zoll, Mikrometer) wird zu einer genaueren Messung gleichzusetzen. Ergo, die Genauigkeit, mit der ein Forscher kann evolutionäre Distanz abzuleiten ist stark durch das Volumen der informativen Daten, um Beziehungen zu messen beeinflusst. Darüber hinaus, weil verschiedene Proben mit unterschiedlichen Geschwindigkeiten und durch unterschiedliche Mechanismen zu entwickeln, die Methode, die wir verwenden, um die Beziehung zwischen zwei Taxa messen auch direkten Einfluss auf die Richtigkeit der Evolutionsmessungen. Dadurch, dass evolutionären Beziehungen sind nicht direkt beobachtet, sondern aus Sequenz oder morphologischen Daten, das Problem der Ableitung evolutionären extrapoliertBeziehungen zu einem der Statistik. Phylogenetics ist der Zweig der mit der Anwendung statistischer Modelle, Muster der Evolution, um optimal zu rekonstruieren, die evolutionäre Geschichte zwischen Taxa betroffenen Biologie. Diese Rekonstruktion zwischen Taxa wird als der Taxa der Stammesgeschichte bezeichnet.

Um zu helfen, die Lücke im Fachwissen zwischen Molekularbiologen und Evolutionsbiologen beschreiben wir hier eine Schritt für Schritt-Pipeline zur Ableitung Phylogenien aus einer Menge von Sequenzen. Erstens haben wir ausführlich die Schritte im Datenbankabfrage, die Basic Local Alignment Search Tool (BLAST-1)-Algorithmus über die Web-basierte Schnittstelle und auch mit lokalen Executables beteiligt, dies ist oft der erste Schritt bei der Erlangung einer Liste von ähnlichen Sequenzen an einen unbekannten Abfrage, obwohl einige Forscher vielleicht auch an der Sammlung von Daten für eine einzelne Gruppe über Web-Schnittstellen wie Phylota (http://www.phylota.net/). BLAST ist ein Algorithmus für comparing primären Aminosäure-oder Nukleotid-Sequenzdaten mit einer Datenbank von Sequenzen für "Hits", der die Abfragesequenz ähneln suchen. Das BLAST-Programm wurde von Stephen Altschul et al ausgelegt. an der National Institutes of Health (NIH) ein. Die BLAST-Server besteht aus einer Reihe verschiedener Programme, und hier ist eine Liste von einigen der häufigsten BLAST-Programme:

i) Nukleotid-Nukleotid-BLAST (blastn): Dieses Programm erfordert eine DNA-Sequenz-Eingang und gibt die meisten ähnliche DNA-Sequenzen aus der DNA-Datenbank, die der Benutzer angibt (z. B. für einen bestimmten Organismus).

ii) Protein-Protein-BLAST (blastp): Hier gibt der Benutzer eine Proteinsequenz und das Programm kehrt die ähnlichsten Proteinsequenzen aus der Proteindatenbank, die der Benutzer angibt.

iii) Position-Specific Iterative BLAST (PSI-BLAST) (blastpgp): Die Benutzereingabe ist ein protein Sequenz, die eine Reihe von eng verwandten Proteinen gibt, und aus diesem Datensatz eine konservierte Profil erzeugt. Als nächstes wird eine neue Abfrage wird unter Verwendung nur dieser konservierten "Motive", die verwendet wird, um ein Protein-Datenbank abzufragen erzeugt und dieses liefert eine größere Gruppe von Proteinen aus dem ein neuer Satz von konservierten "Motive" extrahiert und dann verwendet, um ein Protein-Datenbank abzufragen, bis eine noch größere Reihe von Proteinen werden erneut abgestimmt und ein anderes Profil erzeugt wird, und der Vorgang wiederholt. Indem verwandten Proteinen in der Abfrage in jedem Schritt dieses Programm ermöglicht dem Benutzer, die mehr divergierenden Sequenzen zu identifizieren.

iv) Nukleotid-6-Frame-Übersetzung-Protein (blastx): Hier stellt der Benutzer eine Nukleotid-Sequenz-Eingang, der in die sechs-konzeptionellen Rahmen Translationsprodukte (dh umgewandelt wird, beide Stränge) gegen eine Proteinsequenz-Datenbank..

v) 6-Nucleotid-Nucleotid-Frame-Übersetzung6-Raster-Translation (tblastx): Dieses Programm nimmt eine DNA Nukleotidsequenz Eingang und wandelt die Eingabe in allen sechs Rahmen Translation der Produkte, die sie gegen die sechs-Rahmen-Übersetzung einer Nukleotidsequenz-Datenbank vergleicht.

vi) Protein-Nukleotid-6-Raster-Translation (tblastn): Dieses Programm verwendet eine Proteinsequenz Eingangs gegen alle sechs Leseraster einer Nukleotidsequenz-Datenbank zu vergleichen.

Weiter beschreiben wir häufig verwendete Programme zur Erzeugung eines Multiple Sequenz Alignment (MSA) aus einer Sequenz-Datensatz, und dies wird durch eine Benutzerführung, um Programme, die die Best-Fit-Modelle der Evolution für eine Sequenz-Datensatz zu bestimmen gefolgt. Die phylogenetische Rekonstruktion ist ein statistisches Problem, und aus diesem Grund, müssen phylogenetischen Methoden, um einen statistischen Rahmen zu integrieren. Diese statistischen Rahmen wird ein Evolutionsmodell, das Sequenzänderung innerhalb des Datasets enthält. Dieser evolutionäre model ist aus einer Reihe von Annahmen über den Prozess der Nukleotid-oder Aminosäure-Substitutionen umfasst und die Best-Fit-Modell für eine bestimmte Datenmenge kann durch statistische Tests ausgewählt werden. Die Anpassung an die Daten der verschiedenen Modelle können über Likelihood Ratio Tests (LRT) oder Informationskriterien, um die Best-Fit-Modell innerhalb einer Reihe von möglichen zu wählen verglichen werden. Zwei gemeinsame Informationskriterien sind das Akaike Informationskriterium (AIC) 2 und die Bayes-Informationskriterium (BIC) 3. Sobald eine optimale Ausrichtung erzeugt wird, gibt es viele verschiedene Methoden, um eine phylogeny aus den ausgerichteten Daten. Es gibt zahlreiche Methoden zur Ableitung evolutionären Beziehungen; breit sind, können sie in zwei Kategorien unterteilt werden: abstandsbasierten Verfahren und sequenzbasierte Methoden. Distanz-basierte Methoden berechnen paarweisen Abstände von Sequenzen, und verwenden Sie diese Abstände, um den Baum zu erhalten, dann. Sequenz-basierte Methoden verwenden das Sequenz-Alignment direkt, und in der Regel suchen die tree Raum mit einem Optimalitätskriterium. Wir skizzieren zwei Sequenz-basierte Methoden zur Rekonstruktion von Verwandtschaftsbeziehungen: das sind PhyML 4, die das Maximum-Likelihood-Framework implementiert und mrbayes 5, die Bayes-Markov-Chain-Monte-Carlo-Inferenz verwendet. Wahrscheinlichkeit und Bayes-Methoden liefern eine statistischen Rahmen für phylogenetische Rekonstruktion. Durch die Bereitstellung von Informationen über Benutzer häufig verwendete Baum-Gebäude-Tools, führen wir den Leser auf die notwendigen Daten erforderlich, um Verwandtschaftsverhältnisse zu schließen.

Protokoll

1. Grund Local Alignment Search Tool (BLAST): Online-Schnittstelle

  1. Klicken Sie auf diesen Link, um den BLAST ein Web-Server am National Center for Biotechnology Information (NCBI) zu besuchen. - http://blast.ncbi.nlm.nih.gov/Blast.cgi (Abbildung 1).
  2. Geben Sie einen formatierten Text FASTA Sequenz (siehe Abbildung 2 zum Beispiel) in das Suchfeld.
  3. Klicken Sie auf den entsprechenden BLAST-Programms und entsprechende Datenbank oder einzelne Spezies von Interesse, bei der Suche zu verwenden und dann auf "BLAST".
    Hinweis: FASTA formatierte Sequenz beginnt mit einem durch ein ">"-Zeichen angegeben Beschreibungszeile. Die Beschreibung muss unmittelbar nach dem Zeichen ">", der Folge (dh. Nukleotide oder Aminosäuren), folgen Sie der Beschreibung auf der nächsten Zeile zu folgen. Die Ausgabe aus dem BLAST-Suche als HTML, Text, XML, oder schlagen ta angesehenBles (Text-oder CSV) mit der Standard-HTML-Set (Abbildung 3).

2. Grund Local Alignment Search Tool (BLAST): Lokale Executables

  1. Laden Sie die neuesten BLAST-Befehlszeile ausführbaren BLAST über diesen Link:
    ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ -
  2. em> Für PC-Nutzer: Doppelklicken Sie auf die neueste Hoch win32.exe Datei und die Lizenzvereinbarung akzeptieren und klicken Sie auf installieren.
    Hinweis: Das Standardinstallationsverzeichnis ist C: ncbi-blast-2.2.27 +.
  3. Konfigurieren Sie den PC-Umgebungsvariable wie folgt:
    1. Klicken Sie auf die PC-Schaltfläche "Start", und dann rechts auf "Computer",
    2. Klicken Sie auf "Eigenschaften" und im Pop-up klicken Sie auf die Registerkarte "Erweitert"
    3. Klicken Sie auf die "Schaltfläche Umgebungsvariablen", und in der neuen Pop-up klicken Sie auf die Schaltfläche "Neu" unter the "Benutzervariablen für den Benutzer" Abschnitt
    4. In dem Pop-up hinzufügen den Namen der Variablen "Path" und variablen Wert "C: ncbi-blast-2.2.27 + bin.
      Hinweis: Das Verzeichnis bin enthält die ausführbare Datei (dh blastp etc.)..
  4. em> Für Mac-Anwender: Öffnen Sie das Terminal-Programm (dieses nur geöffnet "Finder" zu tun und suchen "Terminal" und dies wird die "Terminal"-Symbol angezeigt). In das Terminal-Fenster-Typ:
    > Ftp ftp.ncbi.nih.gov
    Hinweis: kann auch die URL oben im Beispiel für PC
  5. Um die NCBI FTP-Site-Typ "anonym" für Name und Kennwort ein, und geben Sie dann zuzugreifen:
    > Cd Explosion / ausführbare Dateien / AKTUELL
  6. Listen Sie die ausführbaren Dateien durch Eingabe von:
    > Ls
  7. Holen Sie sich die neueste Version durch Eingabe des folgenden (oder was auch immer die neueste Version aktuell ist):
    2; bekommen ncbi-blast-2.2.7-macosx.tar.gz
  8. Beenden Sie die FTP-Server NCBI Website durch Eingabe von "exit".
  9. Entpacken Sie die heruntergeladenen Dateien durch Eingabe von:
    > Tar-xzf ncbi-blast-2.2.7-macosx.tar.gz
  10. Fügen Sie den Speicherort der Binärdateien für den Hoch ausführbare Datei, um Ihren Weg, so dass die Schale durch dieses Verzeichnis, wenn man für Befehle, indem Sie suchen:
    > PATH = $ PATH: new_folder_location
  11. Prüfen Sie, ob dieser Mehr die Lage, Ihren Weg durch Eingabe von:
    > Echo $ PATH
  12. Laden Sie eine vorformatierte BLAST-Datenbanken (die täglich aktualisiert werden), indem Sie hier klicken:
    ftp://ftp.ncbi.nlm.nih.gov/blast/db/
  13. Legen Sie die Datenbank in den "db"-Ordner.
  14. em> Auf einem PC: Öffnen Sie eine MS-DOS-Eingabeaufforderung und wechseln Sie in das Verzeichnis der NCBI Blast-Ordner, indem Sie (um diese auf "Start" und geben Sie "cmd" in die Suchleiste zu tun):
    C: Users> cd .. [bewegtbis einem Ordner]
    C: > cd ncbi-blast-2.2.27 +
    Damit wird das Verzeichnis zu ändern:
    C: ncbi-blast-2.2.27 +>
  15. Erstellen Sie die Datenbank mit dem folgenden Befehl "makedb":
    > Makedb-in db / briggsae.fasta-dbtype prot-out db / briggsae
    Anmerkung: In dem folgenden Beispiel (Fig. 4) wird die Datenbank "briggsae" genannt und besteht aus einer Verbindungsgruppe aus dem Organismus Caenorhabditis briggsae besteht.
  16. Erstellen Sie eine Abfrage Proteinsequenz namens "test" durch Einsetzen einer FASTA formatierten Text Protein-Sequenz in das "db"-Ordner.
  17. Fragen Sie die Datenbank über eine blastp Suche, indem Sie den folgenden Befehl ein:
    > Blastp-query db / test.txt-db db / briggsae-out text.txt
  18. em> Auf einem Mac: Laden Sie eine Datenbank für lokale BLAST-Suchen durch Zugriff auf den FTP-NCBI-Website nach den Anweisungen oben (Schritt 2.4) und dien-Typ:
    > Lcd .. / Datenbanken /
  19. Laden Sie die Genom-Sequenz von Interesse oder durch Eingabe von:
    > Bekommen NC_ [Accession #]. Fna
    Anmerkung: ". Fna" bezieht sich auf die FASTA formatierte Nucleotidsequenz und "FAA." Bezieht sich auf den FASTA formaAminosäureSequenzen.
  20. Geben Sie "Beenden", um die FTP-Site zu verlassen.
  21. Stellen Sie die Datenbank durch Eingabe von:
    > Makeblastdb-in db / mouse.faa-out-Maus-dbtype prot
  22. Legen Sie eine formatierte FAST Abfrage-Sequenz in den Ordner "bin" und befragen Sie die Datenbank mit dem folgenden Befehl:
    > Blastp-Abfrage "Ihr query.fasta"-db "Datenbank"-out results.txt

3. Generieren Multiple Sequence Alignments

  1. Klicken Sie auf diese Links, um häufig verwendete Multiple Sequenz Alignment (MSA) Programme zugreifen:
    ClustalW 6 http://www.clustal.org/
    Kalign 7 http://msa.sbc.su.se/cgi-bin/msa.cgi
    MAFFT 8,9 http://mafft.cbrc.jp/alignment/software/
    MUSCLE 10 http://www.drive5.com/muscle/
    T-Coffee 11 http://www.tcoffee.org/Projects/tcoffee/
    Probcons 12 http://toolkit.tuebingen.mpg.de/probcons
  2. Klicken Sie auf diesen Link - http://tcoffee.crg.cat/apps/tcoffee/do:regular - und Eingabe FASTA formatierten Sequenzdaten in das Suchfeld
    Hinweis: Die Ausgabe von T-Kaffee kann in Fig. 5 gesehen werden kann, sind ähnliche Rückstände Farbe codiert.
  3. Laden Sie die Clustal MSA als Kommandozeilenversion (ClustalW) oder einer grafischen version (ClustalX), indem Sie auf diesen Link: http://www.clustal.org/clustal2/ - dann klicken Sie auf die entsprechende ausführbare (dh Win, Linux, Mac OS X).
  4. Daten hochladen, wie FASTA formatierte Textfolge und ausrichten (Abbildung 6).

4. Bestimmen Best-Fit-Modelle Evolution

  1. Klicken Sie hier, um die ProtTest 13 Programm herunterladen:
    http://darwin.uvigo.es/our-software/
  2. Sobald ProtTest heruntergeladen ist, doppelklicken Sie auf die Datei ProtTest.jar
  3. Sobald ProtTest gestartet wird, klicken Sie auf "Datei auswählen" und laden Sie die Sequenzdaten (Abbildung 7).
  4. Dann klicken Sie auf "Start" und das Programm wird (Abbildung 8) beginnen.
    Hinweis: Nach Beendigung der Lauf (Abbildung 8), wird das Programm das beste Modell, basierend auf Kriterien angeben zB "Beste Modell nach AIC: WAG + I + G"

5. Herleitung Sequence Based Phylogenien von Maximum-Likelihood-oder Bayes-Inferenz

  1. Heruntergeladene PhyML 4 hier:
    https://code.google.com/p/phyml/
  2. Starten Sie die ausführbare durch Doppelklick auf die entsprechende Anwendung (dh phyml Windows phyml Linux, etc.) Und die Schnittstelle Fenster öffnet sich (Abbildung 9).
  3. Laden Sie die Eingangssequenz als PHYLIP formatiert Sequenz durch Eingabe von:
    > "Dateiname". Phy
    Hinweis: Um zwischen Sequenzformate zu konvertieren, benutzen Sie die "Readseq" Web-Programm zur Verfügung - http://iubio.bio.indiana.edu/cgi-bin/readseq.cgi .
  4. Starten Sie das Programm durch Eingabe von "Y".
  5. Laden Sie mrbayes 5 hier:
    rceforge.net / download.php "> http://mrbayes.sourceforge.net/download.php
  6. Um das Programm, klicken Sie auf die ausführbare Datei starten und NEXUS formatiert Sequenzdaten lesen, in das Programm durch Eingabe von:
    > Execute "Dateiname". Nex
  7. Stellen Sie die Evolutionsmodell.
  8. Wählen Sie die Anzahl der Generationen, die von der Eingabe ausgeführt wird:
    > Mcmcp ngen = 1000000 [Dies legt die Anzahl der Generationen, 1000000]
    > Sumpf Burnin = 10000 [dies wird die Burnin 10000]
  9. Speichern Sie die Zweiglängen in der Ergebnisdatei, indem Sie:
    > Mcmcp savebrlens = yes
  10. Führen Sie die Analyse durch Eingabe von:
    > Mcmc
  11. Fassen Sie die Bäume mit dem Befehl "SUMT".

6. Visualisierung Phylogenien

  1. Sehen Sie sich eine Liste der Baum-Viewer-Programme hier:
    http://www.treedyn.org/overview/editors.html
  2. Laden Sie die TreeView 14 progrbin hier:
    http://taxonomy.zoology.gla.ac.uk/rod/treeview.html

Ergebnisse

Die Suche nach Ähnlichkeiten zu einer Abfrage ermöglicht es den Forschern, um eine mögliche Identität, neue Sequenzen zuschreiben und auch schließen, Beziehungen zwischen Sequenzen. Die Datei Eingangstyp für BLAST ist ein FASTA formatierten Text-Sequenz oder GenBank-Zugangsnummer. FASTA formatierte Sequenz beginnt mit einem durch ein ">"-Zeichen (Abbildung 2) angegeben Beschreibungszeile. Die Beschreibung muss unmittelbar nach dem Zeichen ">", der Folge (dh...

Diskussion

Unsere Hoffnung für diesen Artikel ist, dass es als Ausgangspunkt dienen, um Forscher und Studenten, die neu für phylogenetics sind zu führen. Genomsequenzierungsprojekte sind günstiger geworden in den letzten Jahren und in der Folge die Nachfrage der Nutzer nach dieser Technologie nimmt zu, und jetzt ist die Produktion von großen Datenmengen Sequenz ist alltäglich in kleinen Labors. Diese Datensätze bieten oft Forscher mit Gruppen von Genen, die eine phylogenetische Rahmen benötigen, um zu beginnen, um ihre Fun...

Offenlegungen

Wir haben nichts zu offenbaren.

Danksagungen

Wir danken Mitglieder der O'Halloran Labor für Kommentare zum Manuskript. Wir danken der George Washington University Department of Biological Sciences und Columbian College of Arts and Sciences für die Finanzierung der Maßnahmen D. O'Halloran.

Materialien

NameCompanyCatalog NumberComments
BLAST webpage http://blast.ncbi.nlm.nih.gov/Blast.cgi
BLAST executables ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/
Preformatted BLAST databasesftp://ftp.ncbi.nlm.nih.gov/blast/db/
Clustalhttp://www.clustal.org/
Kalignhttp://msa.sbc.su.se/cgi-bin/msa.cgi
MAFFThttp://mafft.cbrc.jp/alignment/software/
MUSCLEhttp://www.drive5.com/muscle/
T-Coffeehttp://www.tcoffee.org/Projects/tcoffee/
PROBCONShttp://toolkit.tuebingen.mpg.de/probcons 
Se-Al http://tree.bio.ed.ac.uk/software/seal/
BSEdit http://www.bsedit.org/
JalViewhttp://www.jalview.org/
SeaViewhttp://pbil.univ-lyon1.fr/software/seaview.html
ProtTest https://code.google.com/p/prottest3/
Java Runtime http://www.java.com/en/download/chrome.jsp
Readseqhttp://iubio.bio.indiana.edu/cgi-bin/readseq.cgi
jModelTesthttps://code.google.com/p/jmodeltest2/
PhyMLhttps://code.google.com/p/phyml/
MrBayeshttp://mrbayes.sourceforge.net/download.php
TreeViewhttp://taxonomy.zoology.gla.ac.uk/rod/treeview.html
TreeDynhttp://www.treedyn.org/

Referenzen

  1. Altschul, S. F., Carroll, R. J., Lipman, D. J. Weights for data related by a tree. J. Mol. Biol. 207 (4), 647-653 (1989).
  2. Akaike, H. A new look at the statistical model identification. IEEE Trans. Automat. Contr. 19 (6), 706-723 (1974).
  3. Schwarz, G. Estimating the dimension of a model. Ann. Stat. 6 (2), 461-464 (1978).
  4. Guindon, S., Gascuel, O. A simple, fast, and accurate algorithm to estimate large phylogenies by maximum likelihood. Syst. Biol. 52 (5), 696-704 (2003).
  5. Huelsenbeck, J. P., Ronquist, F. MRBAYES: Bayesian inference of phylogenetic trees. Bioinformatics. 17 (8), 754-755 (2001).
  6. Thompson, J. D., Higgins, D. G., Gibson, T. J. CLUSTAL W: Improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice. Nucleic Acids Res. 22 (22), 4673-4680 (1994).
  7. Lassmann, T., Sonnhammer, E. L. Kalign--an accurate and fast multiple sequence alignment algorithm. BMC Bioinformatics. 6, 298 (2005).
  8. Katoh, K., Kuma, K., Toh, H., Miyata, T. MAFFT version 5: Improvement in accuracy of multiple sequence alignment. Nucleic Acids Res. 33 (2), 511-518 (2005).
  9. Katoh, K., Misawa, K., Kuma, K., Miyata, T. MAFFT: A novel method for rapid multiple sequence alignment based on fast fourier transform. Nucleic Acids Res. 30 (14), 3059-3066 (2002).
  10. Edgar, R. C. MUSCLE: Multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 32 (5), 1792-1797 (2004).
  11. Notredame, C., Higgins, D. G., Heringa, J. T-coffee: A novel method for fast and accurate multiple sequence alignment. J. Mol. Biol. 302 (1), 205-217 (2000).
  12. Do, C. B., Mahabhashyam, M. S., Brudno, M., Batzoglou, S. ProbCons: Probabilistic consistency-based multiple sequence alignment. Genome Res. 15 (2), 330-340 (2005).
  13. Darriba, D., Taboada, G. L., Doallo, R., Posada, D. ProtTest 3: Fast selection of best-fit models of protein evolution. Bioinformatics. 27 (8), 1164-1165 (2011).
  14. Page, R. D. TreeView: An application to display phylogenetic trees on personal computers. Comput. Appl. Biosci. 12 (4), 357-358 (1996).
  15. Darriba, D., Taboada, G. L., Doallo, R., Posada, D. jModelTest 2: More models, new heuristics and parallel computing. Nat. Methods. 9 (8), 772 (2012).
  16. Chevenet, F., Brun, C., Banuls, A. L., Jacq, B., Christen, R. TreeDyn: Towards dynamic graphics and annotations for analyses of trees. BMC Bioinformatics. 7, 439 (2006).

Nachdrucke und Genehmigungen

Genehmigung beantragen, um den Text oder die Abbildungen dieses JoVE-Artikels zu verwenden

Genehmigung beantragen

Weitere Artikel entdecken

Grundlegendes ProtokollPhylogeniemultiplen Sequenz Alignmentsphylogenetische BaumBLAST ausf hrbare DateienGrund lokale Ausrichtung SuchwerkzeugBayes Modelle

This article has been published

Video Coming Soon

JoVE Logo

Datenschutz

Nutzungsbedingungen

Richtlinien

Forschung

Lehre

ÜBER JoVE

Copyright © 2025 MyJoVE Corporation. Alle Rechte vorbehalten