È necessario avere un abbonamento a JoVE per visualizzare questo. Accedi o inizia la tua prova gratuita.
* Questi autori hanno contribuito in egual misura
La traduzione dei ribosomi decodifica tre nucleotidi per codone in peptidi. Il loro movimento lungo l'mRNA, catturato dalla profilazione dei ribosomi, produce le impronte che mostrano la periodicità caratteristica della tripletta. Questo protocollo descrive come utilizzare RiboCode per decifrare questa caratteristica prominente dai dati di profilazione dei ribosomi per identificare i frame di lettura aperti tradotti attivamente a livello di trascrittoma intero.
L'identificazione di frame di lettura aperti (ORF), in particolare quelli che codificano piccoli peptidi e che vengono tradotti attivamente in specifici contesti fisiologici, è fondamentale per annotazioni complete di translatomi dipendenti dal contesto. La profilazione dei ribosomi, una tecnica per rilevare le posizioni di legame e le densità dei ribosomi di traduzione sull'RNA, offre una strada per scoprire rapidamente dove si sta verificando la traduzione su scala genomica. Tuttavia, non è un compito banale in bioinformatica identificare in modo efficiente e completo gli ORF di traduzione per la profilazione dei ribosomi. Qui è descritto un pacchetto facile da usare, chiamato RiboCode, progettato per cercare ORF di qualsiasi dimensione che traducono attivamente da segnali distorti e ambigui nei dati di profilazione dei ribosomi. Prendendo come esempio il nostro set di dati pubblicato in precedenza, questo articolo fornisce istruzioni dettagliate per l'intera pipeline RiboCode, dalla pre-elaborazione dei dati grezzi all'interpretazione dei file dei risultati di output finale. Inoltre, per valutare i tassi di traduzione degli ORF annotati, vengono descritte in dettaglio anche le procedure per la visualizzazione e la quantificazione delle densità dei ribosomi su ciascun ORF. In sintesi, il presente articolo è un'istruzione utile e tempestiva per i campi di ricerca relativi alla traduzione, ai piccoli ORF e ai peptidi.
Recentemente, un numero crescente di studi ha rivelato una produzione diffusa di peptidi tradotti da ORF di geni codificanti e i geni precedentemente annotati come non codificanti, come gli RNA lunghi non codificanti (lncRNA)1,2,3,4,5,6,7,8. Questi ORF tradotti sono regolati o indotti dalle cellule a rispondere ai cambiamenti ambientali, allo stress e alla differenziazione cellulare1,8,9,10,11,12,13. I prodotti di traduzione di alcuni ORF hanno dimostrato di svolgere importanti ruoli regolatori in diversi processi biologici nello sviluppo e nella fisiologia. Ad esempio, Chng et al.14 hanno scoperto un ormone peptidico chiamato Elabela (Ela, noto anche come Apela / Ende / Toddler), che è fondamentale per lo sviluppo cardiovascolare. Pauli et al. hanno suggerito che Ela agisce anche come un mitogeno che promuove la migrazione cellulare nell'embrione di pesce precoce15. Magny et al. hanno riportato due micropeptidi di meno di 30 aminoacidi che regolano il trasporto del calcio e influenzano la contrazione muscolare regolare nel cuore di Drosophila10.
Non è chiaro quanti di questi peptidi siano codificati dal genoma e se siano biologicamente rilevanti. Pertanto, l'identificazione sistematica di questi ORF potenzialmente codificanti è altamente auspicabile. Tuttavia, determinare direttamente i prodotti di questi ORF (cioè proteine o peptidi) utilizzando approcci tradizionali come la conservazione evolutiva16,17 e la spettrometria di massa18,19 è difficile perché l'efficienza di rilevamento di entrambi gli approcci dipende dalla lunghezza, dall'abbondanza e dalla composizione aminoacidica delle proteine o dei peptidi prodotti. L'avvento della profilazione dei ribosomi, una tecnica per identificare l'occupazione del ribosoma sugli mRNA a risoluzione nucleotidica, ha fornito un modo preciso per valutare il potenziale codificante di diversi trascritti3,20,21, indipendentemente dalla loro lunghezza e composizione. Una caratteristica importante e frequentemente utilizzata per identificare gli ORF che traducono attivamente utilizzando la profilazione del ribosoma è la periodicità a tre nucleotidi (3-nt) delle impronte del ribosoma sull'mRNA dal codone di partenza al codone di arresto. Tuttavia, i dati di profilazione dei ribosomi hanno spesso diversi problemi, tra cui letture di sequenziamento basse e sparse lungo orF, rumore di sequenziamento elevato e contaminazioni da RNA ribosomiale (rRNA). Pertanto, i segnali distorti e ambigui generati da tali dati indeboliscono i modelli di periodicità 3-nt delle impronte dei ribosomi sull'mRNA, il che alla fine rende difficile l'identificazione degli ORF tradotti ad alta confidenza.
Un pacchetto denominato "RiboCode" ha adattato un test Wilcoxon-signed-rank modificato e una strategia di integrazione del valore P per esaminare se l'ORF ha significativamente più frammenti protetti da ribosomi (RPF) in-frame rispetto agli RPF off-frame22. È stato dimostrato che è altamente efficiente, sensibile e accurato per l'annotazione de novo del translatome in dati di profilazione del ribosoma simulati e reali. Qui, descriviamo come utilizzare questo strumento per rilevare i potenziali ORF di traduzione dai set di dati di sequenziamento del profilo ribosomi grezzo generati dallo studio precedente23. Questi set di dati sono stati utilizzati per esplorare la funzione della subunità "E" (EIF3E) EIF3E (EIF3E) in traduzione confrontando i profili di occupazione dei ribosomi delle cellule MCF-10A trasfettate con RNA a piccola interferenza (siRNA) di controllo (si-Ctrl) e EIF3E (si-eIF3e). Applicando RiboCode a questi set di dati di esempio, abbiamo rilevato 5.633 nuovi ORF che potenzialmente codificano piccoli peptidi o proteine. Questi ORF sono stati classificati in vari tipi in base alle loro posizioni rispetto alle regioni codificanti, inclusi ORF upstream (uORF), ORF a valle (dORF), ORF sovrapposti, ORF da nuovi geni codificanti proteine (nuovi PCG) e ORF da nuovi geni non codificanti proteine (nuovi NonPCG). Le densità di lettura RPF sugli uORF sono state significativamente aumentate nelle cellule carenti di EIF3E rispetto alle cellule di controllo, il che potrebbe essere almeno parzialmente causato dall'arricchimento dei ribosomi che traducono attivamente. L'accumulo localizzato di ribosomi nella regione dal 25° al 75° codone di cellule carenti di EIF3E ha indicato un blocco dell'allungamento della traduzione nella fase iniziale. Questo protocollo mostra anche come visualizzare la densità RPF della regione desiderata per esaminare i modelli di periodicità 3-nt delle impronte di ribosomi su ORF identificati. Queste analisi dimostrano il potente ruolo di RiboCode nell'identificazione degli ORF di traduzione e nello studio della regolamentazione della traduzione.
1. Configurazione dell'ambiente e installazione di RiboCode
2. Preparazione dei dati
3. Tagliare gli adattatori e rimuovere la contaminazione da rRNA
4. Allineare le letture pulite al genoma
5. Selezione delle dimensioni degli RPF e identificazione dei loro siti P
6. De novo annotate translating ORFs
7. (Facoltativo) Quantificazione e statistica ORF
8. (Opzionale) Visualizzazione degli ORF previsti
9. (Opzionale) Analisi del metagene con RiboMiner
NOTA: eseguire l'analisi del metagene per valutare l'influenza del knockdown EIF3E sulla traduzione di ORF annotati identificati, seguendo i passaggi seguenti:
I set di dati di profilazione dei ribosomi di esempio sono stati depositati nel database GEO con il numero di adesione GSE131074. Tutti i file e i codici utilizzati in questo protocollo sono disponibili nei file supplementari 1-4. Applicando RiboCode a una serie di set di dati pubblicati sul profilo dei ribosomi23, abbiamo identificato i nuovi ORF tradotti attivamente in cellule MCF-10A trattate con siRNA di controllo ed EIF3E. Per selezi...
La profilazione dei ribosomi offre un'opportunità senza precedenti per studiare l'azione dei ribosomi nelle cellule su scala genomica. Decifrare con precisione le informazioni trasportate dai dati di profilazione del ribosoma potrebbe fornire informazioni su quali regioni di geni o trascritti si traducono attivamente. Questo protocollo dettagliato fornisce indicazioni su come utilizzare RiboCode per analizzare i dati di profilazione dei ribosomi in dettaglio, tra cui l'installazione del pacchetto, la preparazione dei da...
Gli autori non hanno conflitti di interesse da divulgare.
Gli autori vorrebbero riconoscere il supporto delle risorse computazionali fornite dalla piattaforma HPCC dell'Università di Xi'an Jiaotong. Z.X. ringrazia con gratitudine il Young Topnotch Talent Support Plan della Xi'an Jiaotong University.
Name | Company | Catalog Number | Comments |
A computer/server running Linux | Any | - | - |
Anaconda or Miniconda | Anaconda | - | Anaconda: https://www.anaconda.com; Miniconda:https://docs.conda.io/en/latest/miniconda.html |
R | R Foundation | - | https://www.r-project.org/ |
Rstudio | Rstudio | - | https://www.rstudio.com/ |
Richiedi autorizzazione per utilizzare il testo o le figure di questo articolo JoVE
Richiedi AutorizzazioneThis article has been published
Video Coming Soon