De novo Identificazione di frame di lettura aperti tradotti attivamente con dati di profilazione dei ribosomi

Yanan Zhu; Fajin Li; Xuerui Yang; Zhengtao Xiao

doi:10.3791/63366

È necessario avere un abbonamento a JoVE per visualizzare questo. Accedi o inizia la tua prova gratuita.

In questo articolo

Riepilogo
Abstract
Introduzione
Protocollo
Risultati
Discussione
Divulgazioni
Riconoscimenti
Materiali
Riferimenti
Ristampe e Autorizzazioni

Riepilogo

La traduzione dei ribosomi decodifica tre nucleotidi per codone in peptidi. Il loro movimento lungo l'mRNA, catturato dalla profilazione dei ribosomi, produce le impronte che mostrano la periodicità caratteristica della tripletta. Questo protocollo descrive come utilizzare RiboCode per decifrare questa caratteristica prominente dai dati di profilazione dei ribosomi per identificare i frame di lettura aperti tradotti attivamente a livello di trascrittoma intero.

Abstract

L'identificazione di frame di lettura aperti (ORF), in particolare quelli che codificano piccoli peptidi e che vengono tradotti attivamente in specifici contesti fisiologici, è fondamentale per annotazioni complete di translatomi dipendenti dal contesto. La profilazione dei ribosomi, una tecnica per rilevare le posizioni di legame e le densità dei ribosomi di traduzione sull'RNA, offre una strada per scoprire rapidamente dove si sta verificando la traduzione su scala genomica. Tuttavia, non è un compito banale in bioinformatica identificare in modo efficiente e completo gli ORF di traduzione per la profilazione dei ribosomi. Qui è descritto un pacchetto facile da usare, chiamato RiboCode, progettato per cercare ORF di qualsiasi dimensione che traducono attivamente da segnali distorti e ambigui nei dati di profilazione dei ribosomi. Prendendo come esempio il nostro set di dati pubblicato in precedenza, questo articolo fornisce istruzioni dettagliate per l'intera pipeline RiboCode, dalla pre-elaborazione dei dati grezzi all'interpretazione dei file dei risultati di output finale. Inoltre, per valutare i tassi di traduzione degli ORF annotati, vengono descritte in dettaglio anche le procedure per la visualizzazione e la quantificazione delle densità dei ribosomi su ciascun ORF. In sintesi, il presente articolo è un'istruzione utile e tempestiva per i campi di ricerca relativi alla traduzione, ai piccoli ORF e ai peptidi.

Introduzione

Recentemente, un numero crescente di studi ha rivelato una produzione diffusa di peptidi tradotti da ORF di geni codificanti e i geni precedentemente annotati come non codificanti, come gli RNA lunghi non codificanti (lncRNA)1,2,3,4,5,6,7,8. Questi ORF tradotti sono regolati o indotti dalle cellule a rispondere ai cambiamenti ambientali, allo stress e alla differenziazione cellulare1,8,9,10,11,12,13. I prodotti di traduzione di alcuni ORF hanno dimostrato di svolgere importanti ruoli regolatori in diversi processi biologici nello sviluppo e nella fisiologia. Ad esempio, Chng et ^{al.14 hanno} scoperto un ormone peptidico chiamato Elabela (Ela, noto anche come Apela / Ende / Toddler), che è fondamentale per lo sviluppo cardiovascolare. Pauli et al. hanno suggerito che Ela agisce anche come un mitogeno che promuove la migrazione cellulare nell'embrione di pesce ^precoce15. Magny et al. hanno riportato due micropeptidi di meno di 30 aminoacidi che regolano il trasporto del calcio e influenzano la contrazione muscolare regolare nel cuore di Drosophila10.

Non è chiaro quanti di questi peptidi siano codificati dal genoma e se siano biologicamente rilevanti. Pertanto, l'identificazione sistematica di questi ORF potenzialmente codificanti è altamente auspicabile. Tuttavia, determinare direttamente i prodotti di questi ORF (cioè proteine o peptidi) utilizzando approcci tradizionali come la conservazione ^{evolutiva16,17} e la spettrometria di ^massa18,19 è difficile perché l'efficienza di rilevamento di entrambi gli approcci dipende dalla lunghezza, dall'abbondanza e dalla composizione aminoacidica delle proteine o dei peptidi prodotti. L'avvento della profilazione dei ribosomi, una tecnica per identificare l'occupazione del ribosoma sugli mRNA a risoluzione nucleotidica, ha fornito un modo preciso per valutare il potenziale codificante di diversi trascritti3,20,21, indipendentemente dalla loro lunghezza e composizione. Una caratteristica importante e frequentemente utilizzata per identificare gli ORF che traducono attivamente utilizzando la profilazione del ribosoma è la periodicità a tre nucleotidi (3-nt) delle impronte del ribosoma sull'mRNA dal codone di partenza al codone di arresto. Tuttavia, i dati di profilazione dei ribosomi hanno spesso diversi problemi, tra cui letture di sequenziamento basse e sparse lungo orF, rumore di sequenziamento elevato e contaminazioni da RNA ribosomiale (rRNA). Pertanto, i segnali distorti e ambigui generati da tali dati indeboliscono i modelli di periodicità 3-nt delle impronte dei ribosomi sull'mRNA, il che alla fine rende difficile l'identificazione degli ORF tradotti ad alta confidenza.

Un pacchetto denominato "RiboCode" ha adattato un test Wilcoxon-signed-rank modificato e una strategia di integrazione del valore P per esaminare se l'ORF ha significativamente più frammenti protetti da ribosomi (RPF) in-frame rispetto agli RPF ^off-frame22. È stato dimostrato che è altamente efficiente, sensibile e accurato per l'annotazione de novo del translatome in dati di profilazione del ribosoma simulati e reali. Qui, descriviamo come utilizzare questo strumento per rilevare i potenziali ORF di traduzione dai set di dati di sequenziamento del profilo ribosomi grezzo generati dallo studio ^precedente23. Questi set di dati sono stati utilizzati per esplorare la funzione della subunità "E" (EIF3E) EIF3E (EIF3E) in traduzione confrontando i profili di occupazione dei ribosomi delle cellule MCF-10A trasfettate con RNA a piccola interferenza (siRNA) di controllo (si-Ctrl) e EIF3E (si-eIF3e). Applicando RiboCode a questi set di dati di esempio, abbiamo rilevato 5.633 nuovi ORF che potenzialmente codificano piccoli peptidi o proteine. Questi ORF sono stati classificati in vari tipi in base alle loro posizioni rispetto alle regioni codificanti, inclusi ORF upstream (uORF), ORF a valle (dORF), ORF sovrapposti, ORF da nuovi geni codificanti proteine (nuovi PCG) e ORF da nuovi geni non codificanti proteine (nuovi NonPCG). Le densità di lettura RPF sugli uORF sono state significativamente aumentate nelle cellule carenti di EIF3E rispetto alle cellule di controllo, il che potrebbe essere almeno parzialmente causato dall'arricchimento dei ribosomi che traducono attivamente. L'accumulo localizzato di ribosomi nella regione dal 25^° al 75^° codone di cellule carenti di EIF3E ha indicato un blocco dell'allungamento della traduzione nella fase iniziale. Questo protocollo mostra anche come visualizzare la densità RPF della regione desiderata per esaminare i modelli di periodicità 3-nt delle impronte di ribosomi su ORF identificati. Queste analisi dimostrano il potente ruolo di RiboCode nell'identificazione degli ORF di traduzione e nello studio della regolamentazione della traduzione.

Access restricted. Please log in or start a trial to view this content.

Protocollo

1. Configurazione dell'ambiente e installazione di RiboCode

Apri una finestra del terminale Linux e crea un ambiente conda:
conda create -n RiboCode python=3.8
Passare all'ambiente creato e installare RiboCode e le dipendenze:
conda attiva RiboCode
conda install -c bioconda ribocode ribominer sra-tools fastx_toolkit cutadapt papillon star samtools

2. Preparazione dei dati

Ottieni i file di riferimento del genoma.
1. Per la sequenza di riferimento, visitare il sito Web ensemble all'https://www.ensembl.org/index.html, fare clic sul menu in alto Download e sul menu a sinistra Download FTP. Nella tabella presentata, fare clic su FASTA nella colonna DNA (FASTA) e nella riga in cui Species è Human. Nella pagina aperta, copia il link di Homo_sapiens. GRCh38.dna.primary_assembly.fa.gz, quindi scaricalo e decomprimilo nel terminale:
  wget -c \
  http://ftp.ensembl.org/pub/release-104/fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz
  gzip -d Homo_sapiens. GRCh38.dna.primary_assembly.fa.gz
2. Per l'annotazione di riferimento, fare clic con il pulsante destro del mouse su GTF nella colonna Set di geni nell'ultima pagina Web aperta. Copia il link di Homo_sapiens. GRCh38.104.gtf.gz e scaricarlo utilizzando:
  wget -c \
  http://ftp.ensembl.org/pub/release-104/gtf/homo_sapiens/Homo_sapiens.GRCh38.104.gtf.gz
  gzip -d Homo_sapiens. GRCh38.104.gtf.gz
  NOTA: Si consiglia di ottenere il file GTF dal sito Web ensemble in quanto contiene annotazioni del genoma organizzate in una gerarchia a tre livelli, ovvero ogni gene contiene trascrizioni che contengono esoni e traduzioni opzionali (ad esempio, sequenze di codifica [CDS], sito di partenza della traduzione, sito finale della traduzione). Quando mancano le annotazioni di un gene o di una trascrizione, ad esempio un file GTF ottenuto da UCSC o NCBI, utilizzare GTFupdate per generare un GTF aggiornato con annotazioni complete della gerarchia padre-figlio: GTFupdate original.gtf > updated.gtf. Per il file di annotazione nel formato .gff, utilizzare il toolkit ^AGAT24 o qualsiasi altro strumento per la conversione nel formato .gtf.
Ottieni sequenze di rRNA.
1. Aprire UCSC Genome Browser all https://genome.ucsc.edu e fare clic su Strumenti | Table Browser nell'elenco a discesa.
2. Nella pagina aperta, specificare Mammifero per clade, Umano per genoma, Tutte le tabelle per gruppo, rmask per tabella e Genoma per regione. Per filtrare, fate clic su Crea (Create ) per passare a una nuova pagina e impostare repClass in modo che corrisponda all'rRNA.
3. Fare clic su Invia e quindi impostare il formato di output su sequenza e nome file di output come hg38_rRNA.fa. Infine, fai clic su Ottieni output | Ottenere la sequenza per recuperare la sequenza rRNA.
Ottenere set di dati di profilazione dei ribosomi da Sequence Read Archive (SRA).
1. Scarica gli esempi di replica del gruppo di trattamento si-eIF3e e rinominali:
  fastq-dump SRR9047190 SRR9047191 SRR9047192
  mv SRR9047190.fastq si-eIF3e-1.fastq
  mv SRR9047191.fastq si-eIF3e-2.fastq
  mv SRR9047192.fastq si-eIF3e-3.fastq
2. Scaricare gli esempi di replica del gruppo di controllo e rinominarli:
  fastq-dump SRR9047193 SRR9047194 SRR9047195
  mv SRR9047193.fastq si-Ctrl-1.fastq
  mv SRR9047194.fastq si-Ctrl-2.fastq
  mv SRR9047195.fastq si-Ctrl-3.fastq
  NOTA: gli ID di adesione SRA per questi set di dati di esempio sono stati ottenuti dal sito Web Gene Expression Omnibus (GEO)²⁵ cercando GSE131074.

3. Tagliare gli adattatori e rimuovere la contaminazione da rRNA

(Facoltativo) Rimuovere gli adattatori dai dati di sequenziazione. Saltare questo passaggio se le sequenze dell'adattatore sono già state tagliate, come in questo caso. In caso contrario, utilizzare cutadapt per tagliare gli adattatori dalle letture.
per i in si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
fare
cutadapt -m 15 --match-read-wildcards -a CTGTAGGCACCATCAAT \
-o ${i}_trimmed.fastq ${i}.fastq
fatto
NOTA: la sequenza dell'adattatore dopo -a parametro varia a seconda della preparazione della libreria cDNA. Le letture più corte di 15 (date da -m) vengono scartate perché i frammenti protetti dai ribosomi sono solitamente più lunghi di questa dimensione.
Rimuovere la contaminazione da rRNA seguendo i seguenti passaggi:
1. Sequenze di riferimento dell'indice rRNA:
  bowtie-build -f hg38_rRNA.fa hg38_rRNA
2. Allineare le letture al riferimento all'rRNA per escludere le letture provenienti dall'rRNA:
  per i in si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
  fare
  papillon -n 0 -y -a --norc --best --strata -S -p 4 -l 15 \
  --un=./${i}_noncontam.fastq hg38_rRNA -q ${i}.fastq ${i}.aln
  fatto
  -p specifica il numero di thread per l'esecuzione parallela delle attività. Considerando le dimensioni relativamente piccole delle letture RPF, altri argomenti (ad esempio, -n, -y, -a, -norc, --best, --strata e -l) dovrebbero essere specificati per garantire che gli allineamenti riportati siano i migliori. Per maggiori dettagli, fare riferimento al sito web ^bowtie26.

4. Allineare le letture pulite al genoma

Creare un indice del genoma.
mkdir STAR_hg38_genome
STAR --runThreadN 8 --runMode genomeGenerate --genomeDir ./STAR_hg38_genome --genomeFastaFiles Homo_sapiens. GRCh38.dna.primary_assembly.fa --sjdbGTFfile Homo_sapiens. GRCh38.104.gtf
Allineare le letture pulite (nessuna contaminazione da rRNA) al riferimento creato.
per i in si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
fare
STAR --runThreadN 8 --outFilterType Normal --outWigType wiggle --outWigStrand Stranded --outWigNorm RPM --outFilterMismatchNmax 1 --outFilterMultimapNmax 1 --genomeDir STAR_hg38_genome --readFilesIn ${i}_noncontam.fastq --outFileNamePrefix ${i}. --outSAMtype BAM SortedByCoordinate --quantMode TranscriptomeSAM GeneCounts --outSAMattributes All
fatto
NOTA: un nucleotide non templateizzato viene spesso aggiunto all'estremità 5' di ogni lettura dalla trascrittasi ^inversa27, che verrà tagliata in modo efficiente da STAR mentre esegue il soft-clipping per impostazione predefinita. I parametri per STAR sono descritti nel manuale ^STAR28.
Ordinare e indicizzare i file di allineamento.
per i in si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
fare
samtools sort -T ${i}. Aligned.toTranscriptome.out.sorted \
-o ${i}. Aligned.toTranscriptome.out.sorted.bam \
${i}. Aligned.toTranscriptome.out.bam
samtools index ${i}. Aligned.toTranscriptome.out.sorted.bam
samtools index ${i}. Aligned.sortedByCoord.out.bam
fatto

5. Selezione delle dimensioni degli RPF e identificazione dei loro siti P

Preparare le annotazioni della trascrizione.
prepare_transcripts -g Homo_sapiens. GRCh38.104.gtf \
-f Homo_sapiens. GRCh38.dna.primary_assembly.fa -o RiboCode_annot
NOTA: questo comando raccoglie le informazioni richieste sui trascritti di mRNA dal file GTF ed estrae le sequenze per tutte le trascrizioni di mRNA dal file FASTA (ogni trascrizione viene assemblata unendo gli esoni secondo le strutture definite nel file GTF).
Seleziona RPF di lunghezze specifiche e identifica le loro posizioni P-site.
per i in si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
fare
metaplots -a RiboCode_annot -r ${i}. Aligned.toTranscriptome.out.bam \
-o ${i} -f0_percent 0,35 -pv1 0,001 -pv2 0,001
fatto
NOTA: questo comando traccia i profili aggregati dell'estremità 5' delle letture allineate di ogni lunghezza attorno ai codoni di inizio (o arresto) della traslazione annotati. Il sito P dipendente dalla lunghezza di lettura può essere determinato manualmente esaminando i grafici di distribuzione (ad esempio, Figura 1B) delle distanze di offset tra le estremità 5' delle letture principali e il codone iniziale. RiboCode genera anche un file di configurazione per ogni campione, in cui vengono determinate automaticamente le posizioni P-site delle letture che visualizzano modelli di periodicità 3-nt significativi. I parametri -f0_percent, -pv1 e -pv2 definiscono la soglia di proporzione e i cutoff del valore p per la selezione delle letture RPF arricchite nel frame di lettura. In questo esempio, i nucleotidi +12, +13 e +13 dall'estremità 5' delle letture 29, 30 e 31 nt vengono definiti manualmente in ogni file di configurazione.
Modificare i file di configurazione per ogni esempio e unirli
NOTA: per generare un set di consenso di ORF univoci e garantire una copertura sufficiente delle letture per eseguire analisi successive, le letture selezionate di tutti i campioni nel passaggio precedente vengono unite. Le letture di lunghezze specifiche definite nel file merged_config.txt (file supplementare 1) e le relative informazioni sul sito P vengono utilizzate per valutare il potenziale di traduzione degli ORF nella fase successiva.

6. De novo annotate translating ORFs

Eseguire RiboCode.
RiboCode -a RiboCode_annot -c merged_config.txt -l yes -g \
-o RiboCode_ORFs_result -s ATG -m 5 -A CTG,GTG,TTG
Dove i parametri importanti di questo comando sono i seguenti:
-c, file di configurazione contenente il percorso dei file di input e le informazioni delle letture selezionate e dei loro siti P.
-l, per i trascritti con codoni di avvio multipli a monte dei codoni di arresto, se gli ORF più lunghi (la regione dal codone di inizio più distale al codone di arresto) vengono utilizzati per valutare il loro potenziale di traduzione. Se impostato su no, i codoni di partenza verranno determinati automaticamente.
-s, il codone o i codone di partenza canonici utilizzati per l'identificazione degli ORF.
-A, (facoltativamente) i codoni iniziali non oncologici (ad esempio, CTG, GTG e TTG per l'uomo) utilizzati per l'identificazione ORF, che possono differire nei mitocondri o nel nucleo di altre ^specie29.
-m, la lunghezza minima (cioè gli amminoacidi) degli ORF.
-o, il prefisso del nome del file di output contenente i dettagli degli ORF previsti (File supplementare 2).
-g e -b, emettono gli ORF previsti rispettivamente in formato gtf o letto .

7. (Facoltativo) Quantificazione e statistica ORF

Il conteggio RPF legge in ogni ORF.
per i in si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
fare
ORFcount -g RiboCode_ORFs_result_collapsed.gtf \
-r ${i}. Aligned.sortedByCoord.out.bam -f 15 -l 5 -m 25 -M 35 \
-o ${i}_ORF.counts -s yes -c intersection-strict
fatto
NOTA: Per escludere i potenziali ribosomi che si accumulano intorno all'inizio e alla fine degli ORF, il numero di letture allocate nei primi 15 (specificati da -f) e negli ultimi 5 codoni (specifici per -l) non vengono conteggiati. Facoltativamente, le lunghezze degli RPF conteggiati sono limitate all'intervallo da 25 a 35 nt (dimensioni comuni di RPF).
Calcola le statistiche di base degli ORF rilevati utilizzando RiboCode:
Rscript RiboCode_utils. R
NOTA: RiboCode_utils. R (Supplemental File 3) fornisce una serie di statistiche per l'output RiboCode, ad esempio, contando il numero di ORF identificati, visualizzando la distribuzione delle lunghezze ORF e calcolando le densità RPF normalizzate (cioè RPKM, letture per kilobase per milione di letture mappate).

8. (Opzionale) Visualizzazione degli ORF previsti

Ottenere le posizioni relative dei codoni di inizio e arresto per l'ORF desiderato (ad esempio, ENSG00000100902_35292349_35292552_67) sulla sua trascrizione da RiboCode_ORFs_result_collapsed.txt (file supplementare 3). Quindi, traccia la densità delle letture RPF nell'ORF:
plot_orf_density -a RiboCode_annot -c merged_config.txt -t ENST00000622405 \
-s 33 -e 236 --start-codone ATG -o ENSG00000100902_35292349_35292552_67
Dove -s e - e specificano la posizione di inizio e di arresto della traslazione del plottaggio orf. --start-codon definisce il codone iniziale dell'ORF, che apparirà nel titolo della figura. -o definisce il prefisso del nome del file di output.

9. (Opzionale) Analisi del metagene con RiboMiner

NOTA: eseguire l'analisi del metagene per valutare l'influenza del knockdown EIF3E sulla traduzione di ORF annotati identificati, seguendo i passaggi seguenti:

Genera annotazioni di trascrizioni per RiboMiner, che estrae la trascrizione più lunga per ciascun gene in base al file di annotazione generato da RiboCode (passaggio 5.1).
OutputTranscriptInfo -c RiboCode_annot/transcripts_cds.txt \
-g Homo_sapiens. GRCh38.104.gtf -f RiboCode_annot/transcripts_sequence.fa \
-o longest.transcripts.info.txt -O all.transcripts.info.txt
Preparare il file di configurazione per RiboMiner. Copiare il file di configurazione generato dal comando metaplots di RiboCode (passaggio 5.4) e rinominarlo "RiboMiner_config.txt". Quindi, modificarlo in base al formato mostrato nel file supplementare 4.
Analisi dei metageni con RiboMiner
1. Utilizzare MetageneAnalysis per generare un profilo aggregato e mediato delle densità degli RPF tra le trascrizioni.
  MetageneAnalysis -f RiboMiner_config.txt -c longest.transcripts.info.txt \
  -o MA_normed -U codone -M RPKM -u 100 -d 400 -l 100 -n 10 -m 1 -e 5 --norm yes \
  -y 100 --tipo UTR
  Dove i parametri importanti sono: --type, analizzando le regioni CDS o UTR ; --norm, se normalizzata la densità di lettura; -y, il numero di codoni utilizzati per ciascuna trascrizione; -U, densità RPF del grafico a livello di codone o a livello di nt ; -u e -d, definiscono l'intervallo di regioni di analisi relative al codone iniziale o al codone di arresto; -l, la lunghezza minima (cioè il numero di codoni) del CDS; -M, la modalità per il filtraggio delle trascrizioni, conteggi o RPKM; -n conteggi minimi o RPKM in CDS per l'analisi. -m conteggi minimi o RPKM di CDS nella regione normalizzata; -e, il numero di codoni esclusi dalla regione normalizzata.
2. Generare una serie di file pdf per confrontare le occupazioni di ribosomi su mRNA in celle di controllo e cellule carenti di eIF3.
  PlotMetageneAnalysis -i MA_normed_dataframe.txt -o MA_normed \
  -g si-Ctrl,si-eIF3e -r si-Ctrl-1,si-Ctrl-2,si-Ctrl-3__si-eIF3e-1,si-eIF3e-2,si-eIF3e-3 -u 100 -d 400 --mode mean
  NOTA: PlotMetageneAnalysis genera il set di file pdf. I dettagli sull'utilizzo di MetageneAnalysis e PlotMetageneAnalysis sono disponibili sul sito web di RiboMiner30.

Access restricted. Please log in or start a trial to view this content.

Risultati

I set di dati di profilazione dei ribosomi di esempio sono stati depositati nel database GEO con il numero di adesione GSE131074. Tutti i file e i codici utilizzati in questo protocollo sono disponibili nei file supplementari 1-4. Applicando RiboCode a una serie di set di dati pubblicati sul profilo dei ^ribosomi23, abbiamo identificato i nuovi ORF tradotti attivamente in cellule MCF-10A trattate con siRNA di controllo ed EIF3E. Per selezi...

Access restricted. Please log in or start a trial to view this content.

Discussione

La profilazione dei ribosomi offre un'opportunità senza precedenti per studiare l'azione dei ribosomi nelle cellule su scala genomica. Decifrare con precisione le informazioni trasportate dai dati di profilazione del ribosoma potrebbe fornire informazioni su quali regioni di geni o trascritti si traducono attivamente. Questo protocollo dettagliato fornisce indicazioni su come utilizzare RiboCode per analizzare i dati di profilazione dei ribosomi in dettaglio, tra cui l'installazione del pacchetto, la preparazione dei da...

Access restricted. Please log in or start a trial to view this content.

Divulgazioni

Gli autori non hanno conflitti di interesse da divulgare.

Riconoscimenti

Gli autori vorrebbero riconoscere il supporto delle risorse computazionali fornite dalla piattaforma HPCC dell'Università di Xi'an Jiaotong. Z.X. ringrazia con gratitudine il Young Topnotch Talent Support Plan della Xi'an Jiaotong University.

Access restricted. Please log in or start a trial to view this content.

Materiali

Name	Company	Catalog Number	Comments
A computer/server running Linux	Any	-	-
Anaconda or Miniconda	Anaconda	-	Anaconda: https://www.anaconda.com; Miniconda:https://docs.conda.io/en/latest/miniconda.html
R	R Foundation	-	https://www.r-project.org/
Rstudio	Rstudio	-	https://www.rstudio.com/

Riferimenti

Eisenberg, A. R., et al. Translation Initiation Site Profiling Reveals Widespread Synthesis of Non-AUG-Initiated Protein Isoforms in Yeast. Cell Systems. 11 (2), 145-160 (2020).
Spealman, P., et al. Conserved non-AUG uORFs revealed by a novel regression analysis of ribosome profiling data. Genome Research. 28 (2), 214-222 (2018).
Ingolia, N. T., Lareau, L. F., Weissman, J. S. Ribosome profiling of mouse embryonic stem cells reveals the complexity and dynamics of mammalian proteomes. Cell. 147 (4), 789-802 (2011).
Bazzini, A. A., et al. Identification of small ORFs in vertebrates using ribosome footprinting and evolutionary conservation. The EMBO Journal. 33 (9), 981-993 (2014).
Ingolia, N. T., et al. Ribosome profiling reveals pervasive translation outside of annotated protein-coding genes. Cell Reports. 8 (5), 1365-1379 (2014).
Chew, G. L., Pauli, A., Schier, A. F. Conservation of uORF repressiveness and sequence features in mouse, human and zebrafish. Nature Communications. 7, 11663(2016).
Zhang, H., et al. Determinants of genome-wide distribution and evolution of uORFs in eukaryotes. Nature Communications. 12 (1), 1076(2021).
Guenther, U. P., et al. The helicase Ded1p controls use of near-cognate translation initiation codons in 5' UTRs. Nature. 559 (7712), 130-134 (2018).
Goldsmith, J., et al. Ribosome profiling reveals a functional role for autophagy in mRNA translational control. Communications Biology. 3 (1), 388(2020).
Magny, E. G., et al. Conserved regulation of cardiac calcium uptake by peptides encoded in small open reading frames. Science. 341 (6150), 1116-1120 (2013).
Stumpf, C. R., Moreno, M. V., Olshen, A. B., Taylor, B. S., Ruggero, D. The translational landscape of the mammalian cell cycle. Molecular Cell. 52 (4), 574-582 (2013).
Gerashchenko, M. V., Lobanov, A. V., Gladyshev, V. N. Genome-wide ribosome profiling reveals complex translational regulation in response to oxidative stress. Proceedings of the National Academy of Sciences of the United States of America. 109 (43), 17394-17399 (2012).
Andreev, D. E., et al. Oxygen and glucose deprivation induces widespread alterations in mRNA translation within 20 minutes. Genome Biology. 16, 90(2015).
Chng, S. C., Ho, L., Tian, J., Reversade, B. ELABELA: a hormone essential for heart development signals via the apelin receptor. Developmental Cell. 27 (6), 672-680 (2013).
Pauli, A., et al. Toddler: an embryonic signal that promotes cell movement via Apelin receptors. Science. 343 (6172), 1248636(2014).
Stark, A., et al. Discovery of functional elements in 12 Drosophila genomes using evolutionary signatures. Nature. 450 (7167), 219-232 (2007).
Lin, M. F., Jungreis, I., Kellis, M. PhyloCSF: a comparative genomics method to distinguish protein coding and non-coding regions. Bioinformatics. 27 (13), 275-282 (2011).
Slavoff, S. A., et al. Peptidomic discovery of short open reading frame-encoded peptides in human cells. Nature Chemical Biology. 9 (1), 59-64 (2013).
Schwaid, A. G., et al. Chemoproteomic discovery of cysteine-containing human short open reading frames. Journal of the American Chemical Society. 135 (45), 16750-16753 (2013).
Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. Genome-wide annotation and quantitation of translation by ribosome profiling. Current Protocols in Molecular Biology. , Chapter 4 1-19 (2013).
Ingolia, N. T., Ghaemmaghami, S., Newman, J. R., Weissman, J. S. Genome-wide analysis in vivo of translation with nucleotide resolution using ribosome profiling. Science. 324 (5924), 218-223 (2009).
Xiao, Z., et al. De novo annotation and characterization of the translatome with ribosome profiling data. Nucleic Acids Research. 46 (10), 61(2018).
Lin, Y., et al. eIF3 Associates with 80S Ribosomes to Promote Translation Elongation, Mitochondrial Homeostasis, and Muscle Health. Molecular Cell. 79 (4), 575-587 (2020).
Dainat, J. AGAT: Another Gff Analysis Toolkit to handle annotations in any GTF/GFF format. , Available from: https://agat.readthedocs.io/en/latest/gff_to_gtf.html (2020).
Edgar, R. Gene Expression Omnibus. , Available from: https://www.ncbi.nim.nih.gov/geo (2002).
Langmead, B. Bowtie: an ultrafast memory-efficient short read aligner. , Available from: http://bowtie-bio.sourceforge.net/manual.shtml (2021).
Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. The ribosome profiling strategy for monitoring translation in vivo by deep sequencing of ribosome-protected mRNA fragments. Nature Protocols. 7 (8), 1534-1550 (2012).
Dobin, A. STAR manual. , Available from: https://github.com/alexdobin/STAR/blob/master/doc/STARmanual.pdf (2022).
Elzanowski, A. The genetic codes. , Available from: https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi (2019).
Li, F. RiboMiner. , Available from: https://github.com/xryanglab/RiboMiner (2020).
Ingolia, N. T., Hussmann, J. A., Weissman, J. S. Ribosome profiling: global views of translation. Cold Spring Harbor Perspectives in Biology. 11 (5), 032698(2018).
Lee, S., et al. Global mapping of translation initiation sites in mammalian cells at single-nucleotide resolution. Proceedings of the National Academy of Sciences of the United States of America. 109 (37), 2424-2432 (2012).
Gao, X., et al. Quantitative profiling of initiating ribosomes in vivo. Nature Methods. 12 (2), 147-153 (2015).
Spealman, P., Naik, A., McManus, J. uORF-seqr: A Machine Learning-Based approach to the identification of upstream open reading frames in yeast. Methods in Molecular Biol. 2252, 313-329 (2021).
Xiao, Z. RiboCode. , Available from: https://github.com/xryanglab/RiboCode (2018).
Sharma, P., Wu, J., Nilges, B. S., Leidel, S. A. Humans and other commonly used model organisms are resistant to cycloheximide-mediated biases in ribosome profiling experiments. Nature Communications. 12 (1), 5094(2021).

Access restricted. Please log in or start a trial to view this content.

Ristampe e Autorizzazioni

Richiedi autorizzazione per utilizzare il testo o le figure di questo articolo JoVE

Richiedi Autorizzazione

Esplora altri articoli

Biologia Numero 180 Profilazione dei ribosomi cornice di lettura aperta traduzione di mRNA micropeptide uORF dORF

This article has been published

Video Coming Soon

Keep me updated: