Zum Anzeigen dieser Inhalte ist ein JoVE-Abonnement erforderlich. Melden Sie sich an oder starten Sie Ihre kostenlose Testversion.
Method Article
Der Zweck dieses Protokolls ist es, die Evolution und Expression von Kandidatengenen anhand von RNA-Sequenzierungsdaten zu untersuchen.
Das Destillieren und Melden großer Datensätze, wie z. B. das gesamte Genom oder Transkriptomdaten, ist oft eine entmutigende Aufgabe. Eine Möglichkeit, die Ergebnisse aufzuschlüsseln, besteht darin, sich auf eine oder mehrere Genfamilien zu konzentrieren, die für den Organismus und die Studie von Bedeutung sind. In diesem Protokoll skizzieren wir bioinformatische Schritte, um eine Phylogenie zu erzeugen und die Expression von Genen von Interesse zu quantifizieren. Phylogenetische Bäume können Aufschluss darüber geben, wie sich Gene innerhalb und zwischen Arten entwickeln, und die Orthologie offenbaren. Diese Ergebnisse können mit RNA-seq-Daten verbessert werden, um die Expression dieser Gene in verschiedenen Individuen oder Geweben zu vergleichen. Studien der molekularen Evolution und Expression können Modi der Evolution und Erhaltung der Genfunktion zwischen Arten aufdecken. Die Charakterisierung einer Genfamilie kann als Sprungbrett für zukünftige Studien dienen und eine wichtige Genfamilie in einem neuen Genom oder Transkriptom hervorheben.
Fortschritte in sequenzierenden Technologien haben die Sequenzierung von Genomen und Transkriptomen von Nicht-Modellorganismen erleichtert. Neben der erhöhten Machbarkeit der Sequenzierung von DNA und RNA aus vielen Organismen ist eine Fülle von Daten öffentlich verfügbar, um Gene von Interesse zu untersuchen. Der Zweck dieses Protokolls ist es, bioinformatische Schritte zur Untersuchung der molekularen Evolution und Expression von Genen bereitzustellen, die eine wichtige Rolle im interessierender Organismus spielen können.
Die Untersuchung der Evolution eines Gens oder einer Genfamilie kann Einblicke in die Evolution biologischer Systeme geben. Mitglieder einer Genfamilie werden typischerweise durch die Identifizierung konservatorischer Motive oder homologe Gensequenzen bestimmt. Die Evolution der Genfamilie wurde bisher mit Genomen von entfernt verwandten Modellorganismen untersucht1. Eine Einschränkung dieses Ansatzes besteht darin, dass nicht klar ist, wie sich diese Genfamilien in eng verwandten Arten entwickeln und welche Rolle unterschiedliche Umweltselektive Belastungen spielen. In dieses Protokoll schließen wir eine Suche nach Homologen in eng verwandten Arten ein. Durch die Erzeugung einer Phylogenie auf Stammebene können wir Trends in der Evolution der Genfamilie wie konservierte Gene oder linienspezifische Duplikationen feststellen. Auf dieser Ebene können wir auch untersuchen, ob Gene Orthologe oder Paraloge sind. Während viele Homologe wahrscheinlich ähnlich zueinander funktionieren, ist dies nicht unbedingt der Fall2. Die Einbeziehung phylogenetischer Bäume in diese Studien ist wichtig, um festzustellen, ob diese homologen Gene Orthologe sind oder nicht. In Eukaryoten behalten viele Orthologe ähnliche Funktionen innerhalb der Zelle, wie die Fähigkeit von Säugetierproteinen zeigt, die Funktion von Hefeorthologenwiederherzustellen 3. Es gibt jedoch Fälle, in denen ein nicht-orthologes Gen eine charakterisierte Funktion4ausführt.
Phylogenetische Bäume beginnen, Beziehungen zwischen Genen und Arten abzugrenzen, aber die Funktion kann nicht allein auf der Grundlage genetischer Beziehungen zugeordnet werden. Genexpressionsstudien in Kombination mit funktionellen Annotationen und Anreicherungsanalysen bieten eine starke Unterstützung für die Genfunktion. Fälle, in denen die Genexpression quantifiziert und über Individuen oder Gewebetypen hinweg verglichen werden kann, können mehr über die potenzielle Funktion aussagekräftig sein. Das folgende Protokoll folgt Methoden, die bei der Untersuchung von Opsin-Genen in Hydra vulgaris7verwendet werden, aber sie können auf jede Spezies und jede Genfamilie angewendet werden. Die Ergebnisse solcher Studien bilden die Grundlage für die weitere Untersuchung der Genfunktion und Gennetzwerke in Nicht-Modellorganismen. Als Beispiel gibt die Untersuchung der Phylogenie von Opsinen, die Proteine sind, die die Phototransduktionskaskade initiieren, Kontext zur Evolution der Augen und der Lichtdetektion8,9,10,11. In diesem Fall können Nicht-Modellorganismen, insbesondere basale Tierarten wie Nesseltiere oder Ctenophore, die Erhaltung oder Veränderungen der Phototransduktionskaskade und des Sehvermögens über die Kladen12,13,14aufklären. In ähnlicher Weise wird uns die Bestimmung der Phylogenie, Expression und Netzwerke anderer Genfamilien über die molekularen Mechanismen informieren, die Anpassungen zugrunde liegen.
Dieses Protokoll folgt den Tierpflegerichtlinien von UC Irvine.
1. RNA-seq-Bibliotheksvorbereitung
2. Zugreifen auf einen Computercluster
HINWEIS: Die RNA-seq-Analyse erfordert die Manipulation großer Dateien und wird am besten auf einem Computercluster durchgeführt (Materialtabelle).
3. Erhalten Sie RNA-seq-Lesevorgänge
4. Trimmadapter und Lesevorgänge von geringer Qualität (optional)
5. Referenzbaugruppe beziehen
6. Generieren Sie eine De-novo-Baugruppe (Alternative zu Schritt 5)
7. Karte liest sich zum Genom (7.1) oder de novo Transkriptom (7.2)
8. Gene von Interesse identifizieren
HINWEIS: Die folgenden Schritte können mit Nukleotid- oder Protein-FASTA-Dateien durchgeführt werden, funktionieren jedoch am besten und sind mit Proteinsequenzen einfacher. BLAST-Suchen mit Protein zu Protein liefern eher Ergebnisse, wenn zwischen verschiedenen Arten gesucht wird.
9. Phylogenetische Bäume
10. Visualisieren Sie die Genexpression mit TPM
Die oben genannten Methoden sind in Abbildung 1 zusammengefasst und wurden auf einen Datensatz von Hydra vulgaris Geweben angewendet. H. vulgaris ist ein wirbelloses Süßwasser, das zum Stamm Cnidaria gehört, zu dem auch Korallen, Quallen und Seeanämonen gehören. H. vulgaris kann sich asexuell vermehren, indem sie knospen und sie können ihren Kopf und Fuß regenerieren, wenn sie halbiert werden. In dieser Studie wollten wir die Evolution und Expressio...
Der Zweck dieses Protokolls besteht darin, einen Überblick über die Schritte zur Charakterisierung einer Genfamilie unter Verwendung von RNA-seq-Daten zu geben. Diese Methoden haben sich für eine Vielzahl von Arten und Datensätzen4,34,35bewährt. Die hier etablierte Pipeline wurde vereinfacht und sollte einfach genug sein, um von einem Anfänger in der Bioinformatik verfolgt zu werden. Die Bedeutung des Protokolls besteht da...
Die Autoren haben nichts preiszugeben.
Wir danken Adriana Briscoe, Gil Smith, Rabi Murad und Aline G. Rangel für Rat und Anleitung bei der Integration einiger dieser Schritte in unseren Workflow. Wir danken auch Katherine Williams, Elisabeth Rebboah und Natasha Picciani für Kommentare zum Manuskript. Diese Arbeit wurde teilweise durch ein Forschungsstipendium der George E. Hewitt Foundation for Medical an A.M.M unterstützt.
Name | Company | Catalog Number | Comments |
Bioanalyzer-DNA kit | Agilent | 5067-4626 | wet lab materials |
Bioanalyzer-RNA kit | Agilent | 5067-1513 | wet lab materials |
BLAST+ v. 2.8.1 | On computer cluster* https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ | ||
Blast2GO (on your PC) | On local computer https://www.blast2go.com/b2g-register-basic | ||
boost v. 1.57.0 | On computer cluster | ||
Bowtie v. 1.0.0 | On computer cluster https://sourceforge.net/projects/bowtie-bio/files/bowtie/1.3.0/ | ||
Computing cluster (highly recommended) | NOTE: Analyses of genomic data are best done on a high-performance computing cluster because files are very large. | ||
Cufflinks v. 2.2.1 | On computer cluster | ||
edgeR v. 3.26.8 (in R) | In Rstudio https://bioconductor.org/packages/release/bioc/html/edgeR.html | ||
gcc v. 6.4.0 | On computer cluster | ||
Java v. 11.0.2 | On computer cluster | ||
MEGA7 (on your PC) | On local computer https://www.megasoftware.net | ||
MEGAX v. 0.1 | On local computer https://www.megasoftware.net | ||
NucleoSpin RNA II kit | Macherey-Nagel | 740955.5 | wet lab materials |
perl 5.30.3 | On computer cluster | ||
python | On computer cluster | ||
Qubit 2.0 Fluorometer | ThermoFisher | Q32866 | wet lab materials |
R v.4.0.0 | On computer cluster https://cran.r-project.org/src/base/R-4/ | ||
RNAlater | ThermoFisher | AM7021 | wet lab materials |
RNeasy kit | Qiagen | 74104 | wet lab materials |
RSEM v. 1.3.0 | Computer software https://deweylab.github.io/RSEM/ | ||
RStudio v. 1.2.1335 | On local computer https://rstudio.com/products/rstudio/download/#download | ||
Samtools v. 1.3 | Computer software | ||
SRA Toolkit v. 2.8.1 | On computer cluster https://github.com/ncbi/sra-tools/wiki/01.-Downloading-SRA-Toolkit | ||
STAR v. 2.6.0c | On computer cluster https://github.com/alexdobin/STAR | ||
StringTie v. 1.3.4d | On computer cluster https://ccb.jhu.edu/software/stringtie/ | ||
Transdecoder v. 5.5.0 | On computer cluster https://github.com/TransDecoder/TransDecoder/releases | ||
Trimmomatic v. 0.35 | On computer cluster http://www.usadellab.org/cms/?page=trimmomatic | ||
Trinity v.2.8.5 | On computer cluster https://github.com/trinityrnaseq/trinityrnaseq/releases | ||
TRIzol | ThermoFisher | 15596018 | wet lab materials |
TruSeq RNA Library Prep Kit v2 | Illumina | RS-122-2001 | wet lab materials |
TURBO DNA-free Kit | ThermoFisher | AM1907 | wet lab materials |
*Downloads and installation on the computer cluster may require root access. Contact your network administrator. |
Genehmigung beantragen, um den Text oder die Abbildungen dieses JoVE-Artikels zu verwenden
Genehmigung beantragenThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Alle Rechte vorbehalten