È necessario avere un abbonamento a JoVE per visualizzare questo. Accedi o inizia la tua prova gratuita.
Lo scopo di questo protocollo è quello di indagare l'evoluzione e l'espressione dei geni candidati utilizzando i dati di sequenziamento dell'RNA.
Distillare e segnalare set di dati di grandi dimensioni, come i dati sull'intero genoma o sul trascrittame, è spesso un compito scoraggiante. Un modo per abbattere i risultati è concentrarsi su una o più famiglie geniche che sono significative per l'organismo e lo studio. In questo protocollo, delineamo i passaggi bioinformatici per generare una filogenesi e quantificare l'espressione dei geni di interesse. Gli alberi filogenetici possono dare un'idea di come i geni si stanno evolvendo all'interno e tra le specie e rivelare l'ortografia. Questi risultati possono essere migliorati utilizzando i dati RNA-seq per confrontare l'espressione di questi geni in diversi individui o tessuti. Studi sull'evoluzione molecolare e sull'espressione possono rivelare modi di evoluzione e conservazione della funzione genica tra le specie. La caratterizzazione di una famiglia genica può servire come trampolino di lancio per studi futuri e può evidenziare un'importante famiglia genica in un nuovo genoma o carta del trascrittame.
I progressi nelle tecnologie di sequenziamento hanno facilitato il sequenziamento di genomi e trascrittimi di organismi non modello. Oltre alla maggiore fattibilità del sequenziamento di DNA e RNA da molti organismi, è disponibile al pubblico un'abbondanza di dati per studiare i geni di interesse. Lo scopo di questo protocollo è quello di fornire misure bioinformatiche per indagare l'evoluzione molecolare e l'espressione di geni che possono svolgere un ruolo importante nell'organismo di interesse.
Studiare l'evoluzione di un gene o di una famiglia genica può fornire informazioni sull'evoluzione dei sistemi biologici. I membri di una famiglia genica sono tipicamente determinati identificando motivi conservati o sequenze geniche omologhe. L'evoluzione della famiglia genica è stata precedentemente studiata utilizzando genomi di organismi modellolontanamente correlati 1. Una limitazione a questo approccio è che non è chiaro come queste famiglie geniche si evolvano in specie strettamente correlate e il ruolo delle diverse pressioni selettive ambientali. In questo protocollo, includiamo la ricerca di omologhi in specie strettamente correlate. Generando una filogenesi a livello di phylum, possiamo notare tendenze nell'evoluzione della famiglia genica come quella dei geni conservati o duplicazioni specifiche del lignaggio. A questo livello, possiamo anche indagare se i geni sono ortologi o paralogi. Mentre molti omologhi probabilmente funzionano in modo simile l'uno all'altro, questo non è necessariamente ilcaso 2. Incorporare alberi filogenetici in questi studi è importante per risolvere se questi geni omologhi sono ortologi o meno. Negli eucarioti, molti ortologi mantengono funzioni simili all'interno della cellula come evidenziato dalla capacità delle proteine dei mammiferi di ripristinare la funzione degli ortologi di lievito3. Tuttavia, ci sono casi in cui un gene non ortologo svolge una funzione caratterizzata4.
Gli alberi filogenetici iniziano a delineare le relazioni tra geni e specie, ma la funzione non può essere assegnata esclusivamente in base alle relazioni genetiche. Gli studi sull'espressione genica combinati con le annotazioni funzionali e l'analisi dell'arricchimento forniscono un forte supporto per la funzione genica. I casi in cui l'espressione genica può essere quantificata e confrontata tra individui o tipi di tessuto può essere più eloquente della funzione potenziale. Il seguente protocollo segue i metodi utilizzati per studiare i geni opsina in Hydra vulgaris7, ma possono essere applicati a qualsiasi specie e famiglia genica. I risultati di tali studi forniscono una base per ulteriori indagini sulla funzione genica e sulle reti geniche negli organismi non modello. Ad esempio, l'indagine sulla filogenesi delle opsine, che sono proteine che avviano la cascata di fototrasduzione, dà contesto all'evoluzione degli occhi e al rilevamento dellaluce 8,9,10,11. In questo caso, organismi non modello, in particolare specie animali basali come cnidari o ctenofori, possono chiarire la conservazione o i cambiamenti nella cascata di fototraduzione e nella visione attraverso i cladi12,13,14. Allo stesso modo, determinare la filogenesi, l'espressione e le reti di altre famiglie geniche ci informerà sui meccanismi molecolari alla base degli adattamenti.
Questo protocollo segue le linee guida per la cura degli animali uc irvine.
1. Preparazione della libreria RNA-seq
2. Accedere a un cluster di computer
NOTA: l'analisi RNA-seq richiede la manipolazione di file di grandi dimensioni ed è meglio eseguita su un cluster di computer (Table of Materials).
3. Ottenere letture RNA-seq
4. Tagliare adattatori e letture di bassa qualità (opzionale)
5. Ottenere l'assieme di riferimento
6. Generare un assieme de novo (alternativo al passaggio 5)
7. La mappa legge sul genoma (7.1) o sul trascrittame de novo (7.2)
8. Identificare i geni di interesse
NOTA: I seguenti passaggi possono essere eseguiti con file FASTA nucleotidici o proteici, ma funzionano meglio e sono più semplici con sequenze proteiche. Blast cerca utilizzando proteine e proteine è più probabile che dia risultati durante la ricerca tra diverse specie.
9. Alberi filogenetici
10. Visualizzare l'espressione genica usando TPM
I metodi di cui sopra sono riassunti nella figura 1 e sono stati applicati a un insieme di dati di tessuti Hydra vulgaris. H. vulgaris è un invertebrato di acqua dolce che appartiene al phylum Cnidaria che comprende anche coralli, meduse e anemoni di mare. H. vulgaris può riprodursi asessualmente germogliando e possono rigenerare la testa e il piede quando vengono bisessuali. In questo studio, abbiamo mirato a indagare l'evoluzione e l'espressione dei ge...
Lo scopo di questo protocollo è quello di fornire una descrizione dei passaggi per caratterizzare una famiglia genica utilizzando i dati RNA-seq. Questi metodi hanno dimostrato di funzionare per una varietà di specie e set di dati4,34,35. Il gasdotto qui stabilito è stato semplificato e dovrebbe essere abbastanza facile da essere seguito da un principiante della bioinformatica. Il significato del protocollo è che delinea tut...
Gli autori non hanno nulla da rivelare.
Ringraziamo Adriana Briscoe, Gil Smith, Rabi Murad e Aline G. Rangel per i consigli e le indicazioni nell'incorporare alcuni di questi passaggi nel nostro flusso di lavoro. Siamo anche grati a Katherine Williams, Elisabeth Rebboah e Natasha Picciani per i commenti sul manoscritto. Questo lavoro è stato sostenuto in parte da una borsa di studio della George E. Hewitt Foundation for Medical research presso A.M.M.
Name | Company | Catalog Number | Comments |
Bioanalyzer-DNA kit | Agilent | 5067-4626 | wet lab materials |
Bioanalyzer-RNA kit | Agilent | 5067-1513 | wet lab materials |
BLAST+ v. 2.8.1 | On computer cluster* https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ | ||
Blast2GO (on your PC) | On local computer https://www.blast2go.com/b2g-register-basic | ||
boost v. 1.57.0 | On computer cluster | ||
Bowtie v. 1.0.0 | On computer cluster https://sourceforge.net/projects/bowtie-bio/files/bowtie/1.3.0/ | ||
Computing cluster (highly recommended) | NOTE: Analyses of genomic data are best done on a high-performance computing cluster because files are very large. | ||
Cufflinks v. 2.2.1 | On computer cluster | ||
edgeR v. 3.26.8 (in R) | In Rstudio https://bioconductor.org/packages/release/bioc/html/edgeR.html | ||
gcc v. 6.4.0 | On computer cluster | ||
Java v. 11.0.2 | On computer cluster | ||
MEGA7 (on your PC) | On local computer https://www.megasoftware.net | ||
MEGAX v. 0.1 | On local computer https://www.megasoftware.net | ||
NucleoSpin RNA II kit | Macherey-Nagel | 740955.5 | wet lab materials |
perl 5.30.3 | On computer cluster | ||
python | On computer cluster | ||
Qubit 2.0 Fluorometer | ThermoFisher | Q32866 | wet lab materials |
R v.4.0.0 | On computer cluster https://cran.r-project.org/src/base/R-4/ | ||
RNAlater | ThermoFisher | AM7021 | wet lab materials |
RNeasy kit | Qiagen | 74104 | wet lab materials |
RSEM v. 1.3.0 | Computer software https://deweylab.github.io/RSEM/ | ||
RStudio v. 1.2.1335 | On local computer https://rstudio.com/products/rstudio/download/#download | ||
Samtools v. 1.3 | Computer software | ||
SRA Toolkit v. 2.8.1 | On computer cluster https://github.com/ncbi/sra-tools/wiki/01.-Downloading-SRA-Toolkit | ||
STAR v. 2.6.0c | On computer cluster https://github.com/alexdobin/STAR | ||
StringTie v. 1.3.4d | On computer cluster https://ccb.jhu.edu/software/stringtie/ | ||
Transdecoder v. 5.5.0 | On computer cluster https://github.com/TransDecoder/TransDecoder/releases | ||
Trimmomatic v. 0.35 | On computer cluster http://www.usadellab.org/cms/?page=trimmomatic | ||
Trinity v.2.8.5 | On computer cluster https://github.com/trinityrnaseq/trinityrnaseq/releases | ||
TRIzol | ThermoFisher | 15596018 | wet lab materials |
TruSeq RNA Library Prep Kit v2 | Illumina | RS-122-2001 | wet lab materials |
TURBO DNA-free Kit | ThermoFisher | AM1907 | wet lab materials |
*Downloads and installation on the computer cluster may require root access. Contact your network administrator. |
Richiedi autorizzazione per utilizzare il testo o le figure di questo articolo JoVE
Richiedi AutorizzazioneEsplora altri articoli
This article has been published
Video Coming Soon