De novo Identification de cadres de lecture ouverts activement traduits avec des données de profilage de ribosomes

Yanan Zhu; Fajin Li; Xuerui Yang; Zhengtao Xiao

doi:10.3791/63366

Auteurs

Contactez-nous

S'identifier

Un abonnement à JoVE est nécessaire pour voir ce contenu. Connectez-vous ou commencez votre essai gratuit.

Dans cet article

Résumé
Résumé
Introduction
Protocole
Résultats
Discussion
Déclarations de divulgation
Remerciements
matériels
Références
Réimpressions et Autorisations

Résumé

La traduction des ribosomes décode trois nucléotides par codon en peptides. Leur mouvement le long de l’ARNm, capturé par profilage des ribosomes, produit les empreintes présentant une périodicité caractéristique du triplet. Ce protocole décrit comment utiliser RiboCode pour déchiffrer cette caractéristique importante à partir des données de profilage des ribosomes afin d’identifier les cadres de lecture ouverts activement traduits au niveau du transcriptome entier.

Résumé

L’identification des cadres de lecture ouverts (ORF), en particulier ceux codant de petits peptides et étant activement traduits dans des contextes physiologiques spécifiques, est essentielle pour des annotations complètes de translatomes dépendants du contexte. Le profilage des ribosomes, une technique permettant de détecter les emplacements de liaison et les densités de traduction des ribosomes sur l’ARN, offre un moyen de découvrir rapidement où la traduction se produit à l’échelle du génome. Cependant, ce n’est pas une tâche triviale en bioinformatique d’identifier efficacement et de manière exhaustive les ORF de traduction pour le profilage des ribosomes. Décrit ici est un paquet facile à utiliser, nommé RiboCode, conçu pour rechercher la traduction active d’ORF de toute taille à partir de signaux déformés et ambigus dans les données de profilage des ribosomes. En prenant notre jeu de données précédemment publié comme exemple, cet article fournit des instructions étape par étape pour l’ensemble du pipeline RiboCode, du prétraitement des données brutes à l’interprétation des fichiers de résultats de sortie finaux. En outre, pour évaluer les taux de traduction des ORF annotés, les procédures de visualisation et de quantification des densités de ribosomes sur chaque ORF sont également décrites en détail. En résumé, le présent article est une instruction utile et opportune pour les domaines de recherche liés à la traduction, aux petits ORF et aux peptides.

Introduction

Récemment, un nombre croissant d’études a révélé une production généralisée de peptides traduits à partir d’ORF de gènes codants et des gènes précédemment annotés comme non codants, tels que les ARN longs non codants (LNCRNA)1,2,3,4,5,6,7,8. Ces ORF traduits sont régulés ou induits par les cellules pour répondre aux changements environnementaux, au stress et à la différenciation cellulaire1,8,9,10,11,12,13. Il a été démontré que les produits de traduction de certains ORF jouent un rôle réglementaire important dans divers processus biologiques de développement et de physiologie. Par exemple, Chng et ^al.14 ont découvert une hormone peptidique nommée Elabela (Ela, également connue sous le nom d’Apela / Ende / Toddler), qui est essentielle au développement cardiovasculaire. Pauli et al. ont suggéré qu’Ela agit également comme un mitogène qui favorise la migration cellulaire dans l’embryon de poisson ^précoce15. Magny et al. ont rapporté deux micropeptides de moins de 30 acides aminés régulant le transport du calcium et affectant la contraction musculaire régulière dans le cœur de la ^drosophile10.

On ne sait toujours pas combien de ces peptides sont codés par le génome et s’ils sont biologiquement pertinents. Par conséquent, l’identification systématique de ces ORF potentiellement codants est hautement souhaitable. Cependant, il est difficile de déterminer directement les produits de ces ORF (c.-à-d. protéines ou peptides) à l’aide d’approches traditionnelles telles que la conservation ^{évolutive16,17} et la spectrométrie de ^masse18,19, car l’efficacité de détection des deux approches dépend de la longueur, de l’abondance et de la composition en acides aminés des protéines ou des peptides produits. L’avènement du profilage des ribosomes, une technique permettant d’identifier l’occupation des ribosomes sur les ARNm à résolution nucléotidique, a fourni un moyen précis d’évaluer le potentiel codant de différents transcripts3,20,21, indépendamment de leur longueur et de leur composition. Une caractéristique importante et fréquemment utilisée pour identifier la traduction active des ORF à l’aide du profilage des ribosomes est la périodicité à trois nucléotides (3-nt) des empreintes du ribosome sur l’ARNm, du codon de départ au codon d’arrêt. Cependant, les données de profilage des ribosomes présentent souvent plusieurs problèmes, notamment des lectures de séquençage faibles et clairsemées le long des ORF, un bruit de séquençage élevé et des contaminations par l’ARN ribosomique (ARNr). Ainsi, les signaux déformés et ambigus générés par de telles données affaiblissent les modèles de périodicité 3-nt des empreintes des ribosomes sur l’ARNm, ce qui rend finalement difficile l’identification des ORF traduits à haut degré de confiance.

Un package nommé « RiboCode » a adapté un test de rang signé Wilcoxon modifié et une stratégie d’intégration de la valeur P pour examiner si l’ORF a significativement plus de fragments protégés par ribosomes (RPF) dans le cadre que les RPF hors ^cadre22. Il a été démontré qu’il était très efficace, sensible et précis pour l’annotation de novo du translatome dans des données de profilage de ribosomes simulées et réelles. Ici, nous décrivons comment utiliser cet outil pour détecter les ORF de traduction potentiels à partir des ensembles de données de séquençage de profilage de ribosomes bruts générés par l’étude ^{précédente23}. Ces ensembles de données avaient été utilisés pour explorer la fonction de la sous-unité EIF3 « E » (EIF3E) en traduction en comparant les profils d’occupation des ribosomes des cellules MCF-10A transfectées avec des ARN témoins (si-Ctrl) et EIF3E (si-eIF3e) à faible interférence (siARN). En appliquant RiboCode à ces exemples d’ensembles de données, nous avons détecté 5 633 nouveaux ORF codant potentiellement de petits peptides ou protéines. Ces ORF ont été classés en différents types en fonction de leur emplacement par rapport aux régions codantes, y compris les ORF en amont (uORF), les ORF en aval (dORF), les ORF superposés, les ORF provenant de nouveaux gènes codant pour les protéines (nouveaux PCG) et les ORF de nouveaux gènes non codant pour les protéines (nouveaux nonCPC). Les densités de lecture du FPR sur les uORF ont été significativement augmentées dans les cellules déficientes en EIF3E par rapport aux cellules témoins, ce qui pourrait être au moins partiellement causé par l’enrichissement des ribosomes à traduction active. L’accumulation localisée de ribosomes dans la région du ^25e au ^75e codon de cellules déficientes en EIF3E indiquait un blocage de l’allongement de la traduction au stade précoce. Ce protocole montre également comment visualiser la densité RPF de la région souhaitée pour examiner les modèles de périodicité 3-nt des empreintes de ribosomes sur les ORF identifiés. Ces analyses démontrent le rôle puissant de RiboCode dans l’identification de la traduction des ORF et l’étude de la régulation de la traduction.

Access restricted. Please log in or start a trial to view this content.

Protocole

1. Configuration de l’environnement et installation de RiboCode

Ouvrez une fenêtre de terminal Linux et créez un environnement conda :
conda create -n RiboCode python=3.8
Basculez vers l’environnement créé et installez RiboCode et les dépendances :
conda activer RiboCode
conda install -c bioconda ribocode ribominer sra-tools fastx_toolkit cutadapt nœud papillon étoile samtools

2. Préparation des données

Obtenez des fichiers de référence du génome.
1. Pour la séquence de référence, rendez-vous sur le site Web d’Ensemble à https://www.ensembl.org/index.html, cliquez sur le menu supérieur Télécharger et sur le menu de gauche Téléchargement FTP. Dans le tableau présenté, cliquez sur FASTA dans la colonne ADN (FASTA) et la ligne où Species is Human. Dans la page ouverte, copiez le lien de Homo_sapiens. GRCh38.dna.primary_assembly.fa.gz, puis téléchargez-le et décompressez-le dans le terminal:
  wget -c \
  http://ftp.ensembl.org/pub/release-104/fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz
  gzip -d Homo_sapiens. GRCh38.dna.primary_assembly.fa.gz
2. Pour l’annotation de référence, cliquez avec le bouton droit sur GTF dans la colonne Ensembles de gènes de la dernière page Web ouverte. Copiez le lien de Homo_sapiens. GRCh38.104.gtf.gz et téléchargez-le en utilisant:
  wget -c \
  http://ftp.ensembl.org/pub/release-104/gtf/homo_sapiens/Homo_sapiens.GRCh38.104.gtf.gz
  gzip -d Homo_sapiens. GRCh38.104.gtf.gz
  REMARQUE: Il est recommandé d’obtenir le fichier GTF sur le site Web de l’Ensemble car il contient des annotations de génome organisées dans une hiérarchie à trois niveaux, c’est-à-dire que chaque gène contient des transcriptions contenant des exons et des traductions facultatives (par exemple, séquences codantes [CDS], site de début de traduction, site de fin de traduction). Lorsque les annotations d’un gène ou d’une transcription sont manquantes, par exemple un fichier GTF obtenu auprès de l’UCSC ou du NCBI, utilisez GTFupdate pour générer un GTF mis à jour avec des annotations complètes de hiérarchie parent-enfant : GTFupdate original.gtf > updated.gtf. Pour le fichier d’annotation au format .gff, utilisez la boîte à outils ^AGAT24 ou tout autre outil pour convertir au format .gtf.
Obtenez des séquences d’ARNr.
1. Ouvrez UCSC Genome Browser à https://genome.ucsc.edu et cliquez sur Outils | Navigateur de tableau dans la liste déroulante.
2. Sur la page ouverte, spécifiez Mammifère pour le clade, Humain pour le génome, Toutes les tables pour le groupe, rmask pour le tableau et génome pour la région. Pour filtrer, cliquez sur Créer pour accéder à une nouvelle page et définir repClass comme correspondant à l’ARNr.
3. Cliquez sur Envoyer , puis définissez le format de sortie sur séquence et nom de fichier de sortie comme hg38_rRNA.fa. Enfin, cliquez sur Obtenir la | de sortie Obtenir la séquence pour récupérer la séquence d’ARNr.
Obtenez des jeux de données de profilage de ribosomes à partir de Sequence Read Archive (SRA).
1. Téléchargez les échantillons répliqués du groupe de traitement si-eIF3e et renommez-les :
  fastq-dump SRR9047190 SRR9047191 SRR9047192
  mv SRR9047190.fastq si-eIF3e-1.fastq
  mv SRR9047191.fastq si-eIF3e-2.fastq
  mv SRR9047192.fastq si-eIF3e-3.fastq
2. Téléchargez les exemples répliqués du groupe témoin et renommez-les :
  fastq-dump SRR9047193 SRR9047194 SRR9047195
  mv SRR9047193.fastq si-Ctrl-1.fastq
  mv SRR9047194.fastq si-Ctrl-2.fastq
  mv SRR9047195.fastq si-Ctrl-3.fastq
  REMARQUE : Les ID d’accession SRA pour ces exemples d’ensembles de données ont été obtenus à partir du site Web Gene Expression Omnibus (GEO)²⁵ en recherchant GSE131074.

3. Coupez les adaptateurs et éliminez la contamination par l’ARNr

(Facultatif) Supprimez les adaptateurs des données de séquençage. Ignorez cette étape si les séquences de l’adaptateur ont déjà été découpées, comme dans ce cas. Sinon, utilisez cutadapt pour découper les adaptateurs des lectures.
pour i dans si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
faire
cutadapt -m 15 --match-read-wildcards -a CTGTAGGCACCATCAAT \
-o ${i}_trimmed.fastq ${i}.fastq
fait
Remarque : La séquence de l’adaptateur après le paramètre -a varie en fonction de la préparation de la bibliothèque d’ADNc. Les lectures inférieures à 15 (données par -m) sont jetées car les fragments protégés par ribosomes sont généralement plus longs que cette taille.
Éliminez la contamination par l’ARNr en procédant comme suit :
1. Séquences de référence de l’ARNr d’index :
  bowtie-build -f hg38_rRNA.fa hg38_rRNA
2. Alignez les lectures sur la référence de l’ARNr pour exclure les lectures provenant de l’ARNr :
  pour i dans si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
  faire
  nœud papillon -n 0 -y -a --norc --best --strates -S -p 4 -l 15 \
  --un=./${i}_noncontam.fastq hg38_rRNA -q ${i}.fastq ${i}.aln
  fait
  -p spécifie le nombre de threads pour l’exécution parallèle des tâches. Compte tenu de la taille relativement petite des lectures du FPR, d’autres arguments (p. ex., -n, -y, -a, -norc, --best, --strates et -l) doivent être spécifiés pour garantir que les alignements signalés sont les meilleurs. Pour plus de détails, consultez le site Web ^bowtie26.

4. Aligner les lectures propres sur le génome

Créez un index du génome.
mkdir STAR_hg38_genome
STAR --runThreadN 8 --runMode genomeGenerate --genomeDir ./STAR_hg38_genome --genomeFastaFiles Homo_sapiens. GRCh38.dna.primary_assembly.fa --sjdbGTFfile Homo_sapiens. GRCh38.104.gtf
Alignez les lectures propres (pas de contamination par l’ARNr) sur la référence créée.
pour i dans si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
faire
STAR --runThreadN 8 --outFilterType Normal --outWigType wiggle --outWigStrand Stranded --outWigNorm RPM --outFilterMismatchNmax 1 --outFilterMultimapNmax 1 --genomeDir STAR_hg38_genome --readFilesIn ${i}_noncontam.fastq --outFileNamePrefix ${i}. --outSAMtype BAM SortedByCoordinate --quantMode TranscriptomeSAM GeneCounts --outSAMattributes All
fait
REMARQUE: Un nucléotide sans modèle est fréquemment ajouté à l’extrémité 5' de chaque lecture par la transcriptase ^inverse27, qui sera efficacement coupée par STAR car elle effectue un écrêtage progressif par défaut. Les paramètres de STAR sont décrits dans le manuel ^STAR28.
Trier et indexer les fichiers d’alignement.
pour i dans si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
faire
samtools trier -T ${i}. Aligned.toTranscriptome.out.sorted \
-o ${i}. Aligned.toTranscriptome.out.sorted.bam \
${i}. Aligned.toTranscriptome.out.bam
samtools index ${i}. Aligned.toTranscriptome.out.sorted.bam
samtools index ${i}. Aligned.sortedByCoord.out.bam
fait

5. Sélection de la taille des RPF et identification de leurs sites P

Préparez les annotations de transcription.
prepare_transcripts -g Homo_sapiens. GRCh38.104.gtf \
-f Homo_sapiens. GRCh38.dna.primary_assembly.fa -o RiboCode_annot
REMARQUE : Cette commande collecte les informations requises sur les transcriptions d’ARNm du fichier GTF et extrait les séquences de toutes les transcriptions d’ARNm du fichier FASTA (chaque transcription est assemblée en fusionnant les exons selon les structures définies dans le fichier GTF).
Sélectionnez des RPF de longueurs spécifiques et identifiez leurs positions sur le site P.
pour i dans si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
faire
metaplots -a RiboCode_annot -r ${i}. Aligné.toTranscriptome.out.bam \
-o ${i} -f0_percent 0,35 -pv1 0,001 -pv2 0,001
fait
Remarque : Cette commande trace les profils agrégés de l’extrémité 5' des lectures alignées de chaque longueur autour des codons de début (ou d’arrêt) de traduction annotés. Le site P dépendant de la longueur de lecture peut être déterminé manuellement en examinant les diagrammes de distribution (par exemple, la figure 1B) des distances de décalage entre les extrémités 5' des lectures principales et le codon de départ. RiboCode génère également un fichier de configuration pour chaque échantillon, dans lequel les positions du site P des lectures affichant des modèles de périodicité significatifs de 3 nt sont automatiquement déterminées. Les paramètres -f0_percent, -pv1 et -pv2 définissent le seuil de proportion et les seuils de valeur p pour sélectionner les lectures RPF enrichies dans le cadre de lecture. Dans cet exemple, les nucléotides +12, +13 et +13 de l’extrémité 5' des lectures 29, 30 et 31 nt sont définis manuellement dans chaque fichier de configuration.
Modifier les fichiers de configuration de chaque exemple et les fusionner
REMARQUE : Pour générer un ensemble consensuel d’ORF uniques et assurer une couverture suffisante des lectures pour effectuer une analyse ultérieure, les lectures sélectionnées de tous les échantillons de l’étape précédente sont fusionnées. Les lectures des longueurs spécifiques définies dans merged_config.txt fichier (fichier supplémentaire 1) et leurs informations de site P sont utilisées pour évaluer le potentiel de traduction des ORF à l’étape suivante.

6. Annoter de novo la traduction des ORF

Exécutez RiboCode.
RiboCode -a RiboCode_annot -c merged_config.txt -l oui -g \
-o RiboCode_ORFs_result -s ATG -m 5 -A CTG,GTG,TTG
Où les paramètres importants de cette commande sont les suivants :
-c, fichier de configuration contenant le chemin des fichiers d’entrée et les informations des lectures sélectionnées et de leurs P-sites.
-l, pour les transcriptions ayant plusieurs codons de départ en amont des codons d’arrêt, si les ORF les plus longs (la région du codon de départ le plus distal au codon d’arrêt) sont utilisés pour évaluer leur potentiel de traduction. S’ils sont définis sur no, les codons de départ seront automatiquement déterminés.
-s, le(s) codon(s) de départ canonique(s) utilisé(s) pour l’identification des ORF.
-A, (éventuellement) les codons de départ non canoniques (par exemple, CTG, GTG et TTG pour l’homme) utilisés pour l’identification orf, qui peuvent différer dans les mitochondries ou le noyau d’autres ^espèces29.
-m, la longueur minimale (c.-à-d. acides aminés) des ORF.
-o, le préfixe du nom du fichier de sortie contenant les détails des ORF prédits (fichier supplémentaire 2).
-g et -b, produisent les ORF prédits au format gtf ou lit , respectivement.

7. Quantification et statistiques du BLR (facultatif)

Le nombre de FPR est lu dans chaque ORF.
pour i dans si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
faire
ORFcount -g RiboCode_ORFs_result_collapsed.gtf \
-r ${i}. Aligned.sortedByCoord.out.bam -f 15 -l 5 -m 25 -M 35 \
-o ${i}_ORF.counts -s yes -c intersection-strict
fait
REMARQUE: Pour exclure les ribosomes qui s’accumulent potentiellement autour du début et de la fin des ORF, le nombre de lectures allouées dans les 15 premiers (spécifiés par -f) et les 5 derniers codons (spécifiques par -l) ne sont pas comptés. En option, les longueurs des RPF comptés sont limitées à la plage de 25 à 35 nt (tailles courantes des RPF).
Calculez les statistiques de base des ORF détectés à l’aide de RiboCode:
Rscript RiboCode_utils. R
REMARQUE : RiboCode_utils. R (fichier supplémentaire 3) fournit une série de statistiques pour la sortie RiboCode, par exemple, en comptant le nombre d’ORF identifiés, en visualisant la distribution des longueurs ORF et en calculant les densités RPF normalisées (c.-à-d. RPKM, lectures par kilobase par million de lectures cartographiées).

8. Visualisation (facultative) des ORF prévus

Obtenez les positions relatives des codons de départ et d’arrêt pour le BLR souhaité (p. ex., ENSG00000100902_35292349_35292552_67) sur sa transcription à partir de RiboCode_ORFs_result_collapsed.txt (dossier supplémentaire 3). Ensuite, tracez la densité des lectures RPF dans l’ORF :
plot_orf_density -a RiboCode_annot -c merged_config.txt -t ENST00000622405 \
-s 33 -e 236 --start-codon ATG -o ENSG00000100902_35292349_35292552_67
Où -s et -e spécifient la position de début et d’arrêt de la traduction du traçage orf. --start-codon définit le codon de départ de l’ORF, qui apparaîtra dans le titre de la figure. -o définit le préfixe du nom du fichier de sortie.

9. Analyse (facultative) des métagènes à l’aide de RiboMiner

REMARQUE: Effectuer l’analyse des métagènes pour évaluer l’influence de l’élimination de l’EIF3E sur la traduction des ORF annotés identifiés, en suivant les étapes ci-dessous:

Générez des annotations de transcriptions pour RiboMiner, qui extrait la transcription la plus longue pour chaque gène en fonction du fichier d’annotation généré par RiboCode (étape 5.1).
OutputTranscriptInfo -c RiboCode_annot/transcripts_cds.txt \
-g Homo_sapiens. GRCh38.104.gtf -f RiboCode_annot/transcripts_sequence.fa \
-o longest.transcripts.info.txt -O all.transcripts.info.txt
Préparez le fichier de configuration pour RiboMiner. Copiez le fichier de configuration généré par la commande metaplots de RiboCode (étape 5.4) et renommez-le « RiboMiner_config.txt ». Ensuite, modifiez-le en fonction du format indiqué dans le fichier supplémentaire 4.
Analyses de métagènes à l’aide de RiboMiner
1. Utilisez MetageneAnalysis pour générer un profil agrégé et moyenné des densités de RPF entre les transcriptions.
  MetageneAnalysis -f RiboMiner_config.txt -c longest.transcripts.info.txt \
  -o MA_normed -U codon -M RPKM -u 100 -d 400 -l 100 -n 10 -m 1 -e 5 --norme oui \
  -y 100 --type UTR
  Où les paramètres importants sont: --type, en analysant les régions CDS ou UTR ; --norm, si la densité de lecture a été normalisée; -y, le nombre de codons utilisés pour chaque transcription ; -U, diagramme de densité RPF soit au niveau du codon , soit au niveau nt ; -u et -d, définissent la plage des régions d’analyse par rapport au codon de départ ou au codon d’arrêt ; -l, la longueur minimale (c.-à-d. le nombre de codons) du CDS; -M, le mode de filtrage des transcriptions, soit compte , soit RPKM ; -n nombre minimum ou RPKM dans le CDS pour analyse. -m nombre minimum ou RPKM de CDS dans la région normalisée; -e, le nombre de codons exclus de la région normalisée.
2. Générez un ensemble de fichiers PDF pour comparer les occupations de ribosomes sur l’ARNm dans les cellules témoins et les cellules déficientes en eIF3.
  PlotMetageneAnalysis -i MA_normed_dataframe.txt -o MA_normed \
  -g si-Ctrl,si-eIF3e -r si-Ctrl-1,si-Ctrl-2,si-Ctrl-3__si-eIF3e-1,si-eIF3e-2,si-eIF3e-3 -u 100 -d 400 --mode moyenne
  REMARQUE : PlotMetageneAnalysis génère l’ensemble des fichiers pdf. Des détails sur l’utilisation de MetageneAnalysis et PlotMetageneAnalysis sont disponibles sur le site Web de RiboMiner30.

Access restricted. Please log in or start a trial to view this content.

Résultats

Les exemples d’ensembles de données de profilage de ribosomes ont été déposés dans la base de données GEO sous le numéro d’acquisition GSE131074. Tous les fichiers et codes utilisés dans ce protocole sont disponibles à partir des fichiers supplémentaires 1 à 4. En appliquant RiboCode à un ensemble de données publiées sur le profilage des ^ribosomes23, nous avons identifié les nouveaux ORF activement traduits dans les cellules MCF...

Access restricted. Please log in or start a trial to view this content.

Discussion

Le profilage des ribosomes offre une occasion sans précédent d’étudier l’action des ribosomes dans les cellules à l’échelle du génome. Déchiffrer précisément les informations véhiculées par les données de profilage des ribosomes pourrait donner un aperçu des régions de gènes ou de transcriptions qui se traduisent activement. Ce protocole étape par étape fournit des conseils sur la façon d’utiliser RiboCode pour analyser en détail les données de profilage des ribosomes, y compris l’installati...

Access restricted. Please log in or start a trial to view this content.

Déclarations de divulgation

Les auteurs n’ont aucun conflit d’intérêts à divulguer.

Remerciements

Les auteurs tiennent à souligner le soutien des ressources informatiques fournies par la plate-forme HPCC de l’Université Xi’an Jiaotong. Z.X. remercie chaleureusement le Young Topnotch Talent Support Plan de l’Université Xi’an Jiaotong.

Access restricted. Please log in or start a trial to view this content.

matériels

Name	Company	Catalog Number	Comments
A computer/server running Linux	Any	-	-
Anaconda or Miniconda	Anaconda	-	Anaconda: https://www.anaconda.com; Miniconda:https://docs.conda.io/en/latest/miniconda.html
R	R Foundation	-	https://www.r-project.org/
Rstudio	Rstudio	-	https://www.rstudio.com/

Références

Eisenberg, A. R., et al. Translation Initiation Site Profiling Reveals Widespread Synthesis of Non-AUG-Initiated Protein Isoforms in Yeast. Cell Systems. 11 (2), 145-160 (2020).
Spealman, P., et al. Conserved non-AUG uORFs revealed by a novel regression analysis of ribosome profiling data. Genome Research. 28 (2), 214-222 (2018).
Ingolia, N. T., Lareau, L. F., Weissman, J. S. Ribosome profiling of mouse embryonic stem cells reveals the complexity and dynamics of mammalian proteomes. Cell. 147 (4), 789-802 (2011).
Bazzini, A. A., et al. Identification of small ORFs in vertebrates using ribosome footprinting and evolutionary conservation. The EMBO Journal. 33 (9), 981-993 (2014).
Ingolia, N. T., et al. Ribosome profiling reveals pervasive translation outside of annotated protein-coding genes. Cell Reports. 8 (5), 1365-1379 (2014).
Chew, G. L., Pauli, A., Schier, A. F. Conservation of uORF repressiveness and sequence features in mouse, human and zebrafish. Nature Communications. 7, 11663(2016).
Zhang, H., et al. Determinants of genome-wide distribution and evolution of uORFs in eukaryotes. Nature Communications. 12 (1), 1076(2021).
Guenther, U. P., et al. The helicase Ded1p controls use of near-cognate translation initiation codons in 5' UTRs. Nature. 559 (7712), 130-134 (2018).
Goldsmith, J., et al. Ribosome profiling reveals a functional role for autophagy in mRNA translational control. Communications Biology. 3 (1), 388(2020).
Magny, E. G., et al. Conserved regulation of cardiac calcium uptake by peptides encoded in small open reading frames. Science. 341 (6150), 1116-1120 (2013).
Stumpf, C. R., Moreno, M. V., Olshen, A. B., Taylor, B. S., Ruggero, D. The translational landscape of the mammalian cell cycle. Molecular Cell. 52 (4), 574-582 (2013).
Gerashchenko, M. V., Lobanov, A. V., Gladyshev, V. N. Genome-wide ribosome profiling reveals complex translational regulation in response to oxidative stress. Proceedings of the National Academy of Sciences of the United States of America. 109 (43), 17394-17399 (2012).
Andreev, D. E., et al. Oxygen and glucose deprivation induces widespread alterations in mRNA translation within 20 minutes. Genome Biology. 16, 90(2015).
Chng, S. C., Ho, L., Tian, J., Reversade, B. ELABELA: a hormone essential for heart development signals via the apelin receptor. Developmental Cell. 27 (6), 672-680 (2013).
Pauli, A., et al. Toddler: an embryonic signal that promotes cell movement via Apelin receptors. Science. 343 (6172), 1248636(2014).
Stark, A., et al. Discovery of functional elements in 12 Drosophila genomes using evolutionary signatures. Nature. 450 (7167), 219-232 (2007).
Lin, M. F., Jungreis, I., Kellis, M. PhyloCSF: a comparative genomics method to distinguish protein coding and non-coding regions. Bioinformatics. 27 (13), 275-282 (2011).
Slavoff, S. A., et al. Peptidomic discovery of short open reading frame-encoded peptides in human cells. Nature Chemical Biology. 9 (1), 59-64 (2013).
Schwaid, A. G., et al. Chemoproteomic discovery of cysteine-containing human short open reading frames. Journal of the American Chemical Society. 135 (45), 16750-16753 (2013).
Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. Genome-wide annotation and quantitation of translation by ribosome profiling. Current Protocols in Molecular Biology. , Chapter 4 1-19 (2013).
Ingolia, N. T., Ghaemmaghami, S., Newman, J. R., Weissman, J. S. Genome-wide analysis in vivo of translation with nucleotide resolution using ribosome profiling. Science. 324 (5924), 218-223 (2009).
Xiao, Z., et al. De novo annotation and characterization of the translatome with ribosome profiling data. Nucleic Acids Research. 46 (10), 61(2018).
Lin, Y., et al. eIF3 Associates with 80S Ribosomes to Promote Translation Elongation, Mitochondrial Homeostasis, and Muscle Health. Molecular Cell. 79 (4), 575-587 (2020).
Dainat, J. AGAT: Another Gff Analysis Toolkit to handle annotations in any GTF/GFF format. , Available from: https://agat.readthedocs.io/en/latest/gff_to_gtf.html (2020).
Edgar, R. Gene Expression Omnibus. , Available from: https://www.ncbi.nim.nih.gov/geo (2002).
Langmead, B. Bowtie: an ultrafast memory-efficient short read aligner. , Available from: http://bowtie-bio.sourceforge.net/manual.shtml (2021).
Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. The ribosome profiling strategy for monitoring translation in vivo by deep sequencing of ribosome-protected mRNA fragments. Nature Protocols. 7 (8), 1534-1550 (2012).
Dobin, A. STAR manual. , Available from: https://github.com/alexdobin/STAR/blob/master/doc/STARmanual.pdf (2022).
Elzanowski, A. The genetic codes. , Available from: https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi (2019).
Li, F. RiboMiner. , Available from: https://github.com/xryanglab/RiboMiner (2020).
Ingolia, N. T., Hussmann, J. A., Weissman, J. S. Ribosome profiling: global views of translation. Cold Spring Harbor Perspectives in Biology. 11 (5), 032698(2018).
Lee, S., et al. Global mapping of translation initiation sites in mammalian cells at single-nucleotide resolution. Proceedings of the National Academy of Sciences of the United States of America. 109 (37), 2424-2432 (2012).
Gao, X., et al. Quantitative profiling of initiating ribosomes in vivo. Nature Methods. 12 (2), 147-153 (2015).
Spealman, P., Naik, A., McManus, J. uORF-seqr: A Machine Learning-Based approach to the identification of upstream open reading frames in yeast. Methods in Molecular Biol. 2252, 313-329 (2021).
Xiao, Z. RiboCode. , Available from: https://github.com/xryanglab/RiboCode (2018).
Sharma, P., Wu, J., Nilges, B. S., Leidel, S. A. Humans and other commonly used model organisms are resistant to cycloheximide-mediated biases in ribosome profiling experiments. Nature Communications. 12 (1), 5094(2021).

Access restricted. Please log in or start a trial to view this content.

Réimpressions et Autorisations

Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE

Demande d’autorisation

Explorer plus d’articles

Biologie Num ro 180 Profilage des ribosomes cadre de lecture ouvert traduction de l ARNm micropeptide uORF dORF

This article has been published

Video Coming Soon

Keep me updated: