JoVE Logo

S'identifier

Un abonnement à JoVE est nécessaire pour voir ce contenu. Connectez-vous ou commencez votre essai gratuit.

Dans cet article

  • Résumé
  • Résumé
  • Introduction
  • Protocole
  • Résultats
  • Discussion
  • Déclarations de divulgation
  • Remerciements
  • matériels
  • Références
  • Réimpressions et Autorisations

Résumé

La traduction des ribosomes décode trois nucléotides par codon en peptides. Leur mouvement le long de l’ARNm, capturé par profilage des ribosomes, produit les empreintes présentant une périodicité caractéristique du triplet. Ce protocole décrit comment utiliser RiboCode pour déchiffrer cette caractéristique importante à partir des données de profilage des ribosomes afin d’identifier les cadres de lecture ouverts activement traduits au niveau du transcriptome entier.

Résumé

L’identification des cadres de lecture ouverts (ORF), en particulier ceux codant de petits peptides et étant activement traduits dans des contextes physiologiques spécifiques, est essentielle pour des annotations complètes de translatomes dépendants du contexte. Le profilage des ribosomes, une technique permettant de détecter les emplacements de liaison et les densités de traduction des ribosomes sur l’ARN, offre un moyen de découvrir rapidement où la traduction se produit à l’échelle du génome. Cependant, ce n’est pas une tâche triviale en bioinformatique d’identifier efficacement et de manière exhaustive les ORF de traduction pour le profilage des ribosomes. Décrit ici est un paquet facile à utiliser, nommé RiboCode, conçu pour rechercher la traduction active d’ORF de toute taille à partir de signaux déformés et ambigus dans les données de profilage des ribosomes. En prenant notre jeu de données précédemment publié comme exemple, cet article fournit des instructions étape par étape pour l’ensemble du pipeline RiboCode, du prétraitement des données brutes à l’interprétation des fichiers de résultats de sortie finaux. En outre, pour évaluer les taux de traduction des ORF annotés, les procédures de visualisation et de quantification des densités de ribosomes sur chaque ORF sont également décrites en détail. En résumé, le présent article est une instruction utile et opportune pour les domaines de recherche liés à la traduction, aux petits ORF et aux peptides.

Introduction

Récemment, un nombre croissant d’études a révélé une production généralisée de peptides traduits à partir d’ORF de gènes codants et des gènes précédemment annotés comme non codants, tels que les ARN longs non codants (LNCRNA)1,2,3,4,5,6,7,8. Ces ORF traduits sont régulés ou induits par les cellules pour répondre aux changements environnementaux, au stress et à la différenciation cellulaire1,8,9,10,11,12,13. Il a été démontré que les produits de traduction de certains ORF jouent un rôle réglementaire important dans divers processus biologiques de développement et de physiologie. Par exemple, Chng et al.14 ont découvert une hormone peptidique nommée Elabela (Ela, également connue sous le nom d’Apela / Ende / Toddler), qui est essentielle au développement cardiovasculaire. Pauli et al. ont suggéré qu’Ela agit également comme un mitogène qui favorise la migration cellulaire dans l’embryon de poisson précoce15. Magny et al. ont rapporté deux micropeptides de moins de 30 acides aminés régulant le transport du calcium et affectant la contraction musculaire régulière dans le cœur de la drosophile10.

On ne sait toujours pas combien de ces peptides sont codés par le génome et s’ils sont biologiquement pertinents. Par conséquent, l’identification systématique de ces ORF potentiellement codants est hautement souhaitable. Cependant, il est difficile de déterminer directement les produits de ces ORF (c.-à-d. protéines ou peptides) à l’aide d’approches traditionnelles telles que la conservation évolutive16,17 et la spectrométrie de masse18,19, car l’efficacité de détection des deux approches dépend de la longueur, de l’abondance et de la composition en acides aminés des protéines ou des peptides produits. L’avènement du profilage des ribosomes, une technique permettant d’identifier l’occupation des ribosomes sur les ARNm à résolution nucléotidique, a fourni un moyen précis d’évaluer le potentiel codant de différents transcripts3,20,21, indépendamment de leur longueur et de leur composition. Une caractéristique importante et fréquemment utilisée pour identifier la traduction active des ORF à l’aide du profilage des ribosomes est la périodicité à trois nucléotides (3-nt) des empreintes du ribosome sur l’ARNm, du codon de départ au codon d’arrêt. Cependant, les données de profilage des ribosomes présentent souvent plusieurs problèmes, notamment des lectures de séquençage faibles et clairsemées le long des ORF, un bruit de séquençage élevé et des contaminations par l’ARN ribosomique (ARNr). Ainsi, les signaux déformés et ambigus générés par de telles données affaiblissent les modèles de périodicité 3-nt des empreintes des ribosomes sur l’ARNm, ce qui rend finalement difficile l’identification des ORF traduits à haut degré de confiance.

Un package nommé « RiboCode » a adapté un test de rang signé Wilcoxon modifié et une stratégie d’intégration de la valeur P pour examiner si l’ORF a significativement plus de fragments protégés par ribosomes (RPF) dans le cadre que les RPF hors cadre22. Il a été démontré qu’il était très efficace, sensible et précis pour l’annotation de novo du translatome dans des données de profilage de ribosomes simulées et réelles. Ici, nous décrivons comment utiliser cet outil pour détecter les ORF de traduction potentiels à partir des ensembles de données de séquençage de profilage de ribosomes bruts générés par l’étude précédente23. Ces ensembles de données avaient été utilisés pour explorer la fonction de la sous-unité EIF3 « E » (EIF3E) en traduction en comparant les profils d’occupation des ribosomes des cellules MCF-10A transfectées avec des ARN témoins (si-Ctrl) et EIF3E (si-eIF3e) à faible interférence (siARN). En appliquant RiboCode à ces exemples d’ensembles de données, nous avons détecté 5 633 nouveaux ORF codant potentiellement de petits peptides ou protéines. Ces ORF ont été classés en différents types en fonction de leur emplacement par rapport aux régions codantes, y compris les ORF en amont (uORF), les ORF en aval (dORF), les ORF superposés, les ORF provenant de nouveaux gènes codant pour les protéines (nouveaux PCG) et les ORF de nouveaux gènes non codant pour les protéines (nouveaux nonCPC). Les densités de lecture du FPR sur les uORF ont été significativement augmentées dans les cellules déficientes en EIF3E par rapport aux cellules témoins, ce qui pourrait être au moins partiellement causé par l’enrichissement des ribosomes à traduction active. L’accumulation localisée de ribosomes dans la région du 25e au 75e codon de cellules déficientes en EIF3E indiquait un blocage de l’allongement de la traduction au stade précoce. Ce protocole montre également comment visualiser la densité RPF de la région souhaitée pour examiner les modèles de périodicité 3-nt des empreintes de ribosomes sur les ORF identifiés. Ces analyses démontrent le rôle puissant de RiboCode dans l’identification de la traduction des ORF et l’étude de la régulation de la traduction.

Protocole

1. Configuration de l’environnement et installation de RiboCode

  1. Ouvrez une fenêtre de terminal Linux et créez un environnement conda :
    conda create -n RiboCode python=3.8
  2. Basculez vers l’environnement créé et installez RiboCode et les dépendances :
    conda activer RiboCode
    conda install -c bioconda ribocode ribominer sra-tools fastx_toolkit cutadapt nœud papillon étoile samtools

2. Préparation des données

  1. Obtenez des fichiers de référence du génome.
    1. Pour la séquence de référence, rendez-vous sur le site Web d’Ensemble à https://www.ensembl.org/index.html, cliquez sur le menu supérieur Télécharger et sur le menu de gauche Téléchargement FTP. Dans le tableau présenté, cliquez sur FASTA dans la colonne ADN (FASTA) et la ligne où Species is Human. Dans la page ouverte, copiez le lien de Homo_sapiens. GRCh38.dna.primary_assembly.fa.gz, puis téléchargez-le et décompressez-le dans le terminal:
      wget -c \
      http://ftp.ensembl.org/pub/release-104/fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz
      gzip -d Homo_sapiens. GRCh38.dna.primary_assembly.fa.gz
    2. Pour l’annotation de référence, cliquez avec le bouton droit sur GTF dans la colonne Ensembles de gènes de la dernière page Web ouverte. Copiez le lien de Homo_sapiens. GRCh38.104.gtf.gz et téléchargez-le en utilisant:
      wget -c \
      http://ftp.ensembl.org/pub/release-104/gtf/homo_sapiens/Homo_sapiens.GRCh38.104.gtf.gz
      gzip -d Homo_sapiens. GRCh38.104.gtf.gz

      REMARQUE: Il est recommandé d’obtenir le fichier GTF sur le site Web de l’Ensemble car il contient des annotations de génome organisées dans une hiérarchie à trois niveaux, c’est-à-dire que chaque gène contient des transcriptions contenant des exons et des traductions facultatives (par exemple, séquences codantes [CDS], site de début de traduction, site de fin de traduction). Lorsque les annotations d’un gène ou d’une transcription sont manquantes, par exemple un fichier GTF obtenu auprès de l’UCSC ou du NCBI, utilisez GTFupdate pour générer un GTF mis à jour avec des annotations complètes de hiérarchie parent-enfant : GTFupdate original.gtf > updated.gtf. Pour le fichier d’annotation au format .gff, utilisez la boîte à outils AGAT24 ou tout autre outil pour convertir au format .gtf.
  2. Obtenez des séquences d’ARNr.
    1. Ouvrez UCSC Genome Browser à https://genome.ucsc.edu et cliquez sur Outils | Navigateur de tableau dans la liste déroulante.
    2. Sur la page ouverte, spécifiez Mammifère pour le clade, Humain pour le génome, Toutes les tables pour le groupe, rmask pour le tableau et génome pour la région. Pour filtrer, cliquez sur Créer pour accéder à une nouvelle page et définir repClass comme correspondant à l’ARNr.
    3. Cliquez sur Envoyer , puis définissez le format de sortie sur séquence et nom de fichier de sortie comme hg38_rRNA.fa. Enfin, cliquez sur Obtenir la | de sortie Obtenir la séquence pour récupérer la séquence d’ARNr.
  3. Obtenez des jeux de données de profilage de ribosomes à partir de Sequence Read Archive (SRA).
    1. Téléchargez les échantillons répliqués du groupe de traitement si-eIF3e et renommez-les :
      fastq-dump SRR9047190 SRR9047191 SRR9047192
      mv SRR9047190.fastq si-eIF3e-1.fastq
      mv SRR9047191.fastq si-eIF3e-2.fastq
      mv SRR9047192.fastq si-eIF3e-3.fastq
    2. Téléchargez les exemples répliqués du groupe témoin et renommez-les :
      fastq-dump SRR9047193 SRR9047194 SRR9047195
      mv SRR9047193.fastq si-Ctrl-1.fastq
      mv SRR9047194.fastq si-Ctrl-2.fastq
      mv SRR9047195.fastq si-Ctrl-3.fastq
      REMARQUE : Les ID d’accession SRA pour ces exemples d’ensembles de données ont été obtenus à partir du site Web Gene Expression Omnibus (GEO)25 en recherchant GSE131074.

3. Coupez les adaptateurs et éliminez la contamination par l’ARNr

  1. (Facultatif) Supprimez les adaptateurs des données de séquençage. Ignorez cette étape si les séquences de l’adaptateur ont déjà été découpées, comme dans ce cas. Sinon, utilisez cutadapt pour découper les adaptateurs des lectures.
    pour i dans si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
    faire
    cutadapt -m 15 --match-read-wildcards -a CTGTAGGCACCATCAAT \
    -o ${i}_trimmed.fastq ${i}.fastq
    fait
    Remarque : La séquence de l’adaptateur après le paramètre -a varie en fonction de la préparation de la bibliothèque d’ADNc. Les lectures inférieures à 15 (données par -m) sont jetées car les fragments protégés par ribosomes sont généralement plus longs que cette taille.
  2. Éliminez la contamination par l’ARNr en procédant comme suit :
    1. Séquences de référence de l’ARNr d’index :
      bowtie-build -f hg38_rRNA.fa hg38_rRNA
    2. Alignez les lectures sur la référence de l’ARNr pour exclure les lectures provenant de l’ARNr :
      pour i dans si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
      faire
      nœud papillon -n 0 -y -a --norc --best --strates -S -p 4 -l 15 \
      --un=./${i}_noncontam.fastq hg38_rRNA -q ${i}.fastq ${i}.aln
      fait
      -p spécifie le nombre de threads pour l’exécution parallèle des tâches. Compte tenu de la taille relativement petite des lectures du FPR, d’autres arguments (p. ex., -n, -y, -a, -norc, --best, --strates et -l) doivent être spécifiés pour garantir que les alignements signalés sont les meilleurs. Pour plus de détails, consultez le site Web bowtie26.

4. Aligner les lectures propres sur le génome

  1. Créez un index du génome.
    mkdir STAR_hg38_genome
    STAR --runThreadN 8 --runMode genomeGenerate --genomeDir ./STAR_hg38_genome --genomeFastaFiles Homo_sapiens. GRCh38.dna.primary_assembly.fa --sjdbGTFfile Homo_sapiens. GRCh38.104.gtf
  2. Alignez les lectures propres (pas de contamination par l’ARNr) sur la référence créée.
    pour i dans si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
    faire
    STAR --runThreadN 8 --outFilterType Normal --outWigType wiggle --outWigStrand Stranded --outWigNorm RPM --outFilterMismatchNmax 1 --outFilterMultimapNmax 1 --genomeDir STAR_hg38_genome --readFilesIn ${i}_noncontam.fastq --outFileNamePrefix ${i}. --outSAMtype BAM SortedByCoordinate --quantMode TranscriptomeSAM GeneCounts --outSAMattributes All
    fait
    REMARQUE: Un nucléotide sans modèle est fréquemment ajouté à l’extrémité 5' de chaque lecture par la transcriptase inverse27, qui sera efficacement coupée par STAR car elle effectue un écrêtage progressif par défaut. Les paramètres de STAR sont décrits dans le manuel STAR28.
  3. Trier et indexer les fichiers d’alignement.
    pour i dans si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
    faire
    samtools trier -T ${i}. Aligned.toTranscriptome.out.sorted \
    -o ${i}. Aligned.toTranscriptome.out.sorted.bam \
    ${i}. Aligned.toTranscriptome.out.bam
    samtools index ${i}. Aligned.toTranscriptome.out.sorted.bam
    samtools index ${i}. Aligned.sortedByCoord.out.bam
    fait

5. Sélection de la taille des RPF et identification de leurs sites P

  1. Préparez les annotations de transcription.
    prepare_transcripts -g Homo_sapiens. GRCh38.104.gtf \
    -f Homo_sapiens. GRCh38.dna.primary_assembly.fa -o RiboCode_annot
    REMARQUE : Cette commande collecte les informations requises sur les transcriptions d’ARNm du fichier GTF et extrait les séquences de toutes les transcriptions d’ARNm du fichier FASTA (chaque transcription est assemblée en fusionnant les exons selon les structures définies dans le fichier GTF).
  2. Sélectionnez des RPF de longueurs spécifiques et identifiez leurs positions sur le site P.
    pour i dans si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
    faire
    metaplots -a RiboCode_annot -r ${i}. Aligné.toTranscriptome.out.bam \
    -o ${i} -f0_percent 0,35 -pv1 0,001 -pv2 0,001
    fait
    Remarque : Cette commande trace les profils agrégés de l’extrémité 5' des lectures alignées de chaque longueur autour des codons de début (ou d’arrêt) de traduction annotés. Le site P dépendant de la longueur de lecture peut être déterminé manuellement en examinant les diagrammes de distribution (par exemple, la figure 1B) des distances de décalage entre les extrémités 5' des lectures principales et le codon de départ. RiboCode génère également un fichier de configuration pour chaque échantillon, dans lequel les positions du site P des lectures affichant des modèles de périodicité significatifs de 3 nt sont automatiquement déterminées. Les paramètres -f0_percent, -pv1 et -pv2 définissent le seuil de proportion et les seuils de valeur p pour sélectionner les lectures RPF enrichies dans le cadre de lecture. Dans cet exemple, les nucléotides +12, +13 et +13 de l’extrémité 5' des lectures 29, 30 et 31 nt sont définis manuellement dans chaque fichier de configuration.
  3. Modifier les fichiers de configuration de chaque exemple et les fusionner
    REMARQUE : Pour générer un ensemble consensuel d’ORF uniques et assurer une couverture suffisante des lectures pour effectuer une analyse ultérieure, les lectures sélectionnées de tous les échantillons de l’étape précédente sont fusionnées. Les lectures des longueurs spécifiques définies dans merged_config.txt fichier (fichier supplémentaire 1) et leurs informations de site P sont utilisées pour évaluer le potentiel de traduction des ORF à l’étape suivante.

6. Annoter de novo la traduction des ORF

  1. Exécutez RiboCode.
    RiboCode -a RiboCode_annot -c merged_config.txt -l oui -g \
    -o RiboCode_ORFs_result -s ATG -m 5 -A CTG,GTG,TTG

    Où les paramètres importants de cette commande sont les suivants :
    -c, fichier de configuration contenant le chemin des fichiers d’entrée et les informations des lectures sélectionnées et de leurs P-sites.
    -l, pour les transcriptions ayant plusieurs codons de départ en amont des codons d’arrêt, si les ORF les plus longs (la région du codon de départ le plus distal au codon d’arrêt) sont utilisés pour évaluer leur potentiel de traduction. S’ils sont définis sur no, les codons de départ seront automatiquement déterminés.
    -s, le(s) codon(s) de départ canonique(s) utilisé(s) pour l’identification des ORF.
    -A, (éventuellement) les codons de départ non canoniques (par exemple, CTG, GTG et TTG pour l’homme) utilisés pour l’identification orf, qui peuvent différer dans les mitochondries ou le noyau d’autres espèces29.
    -m, la longueur minimale (c.-à-d. acides aminés) des ORF.
    -o, le préfixe du nom du fichier de sortie contenant les détails des ORF prédits (fichier supplémentaire 2).
    -g et -b, produisent les ORF prédits au format gtf ou lit , respectivement.

7. Quantification et statistiques du BLR (facultatif)

  1. Le nombre de FPR est lu dans chaque ORF.
    pour i dans si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
    faire
    ORFcount -g RiboCode_ORFs_result_collapsed.gtf \
    -r ${i}. Aligned.sortedByCoord.out.bam -f 15 -l 5 -m 25 -M 35 \
    -o ${i}_ORF.counts -s yes -c intersection-strict
    fait
    REMARQUE: Pour exclure les ribosomes qui s’accumulent potentiellement autour du début et de la fin des ORF, le nombre de lectures allouées dans les 15 premiers (spécifiés par -f) et les 5 derniers codons (spécifiques par -l) ne sont pas comptés. En option, les longueurs des RPF comptés sont limitées à la plage de 25 à 35 nt (tailles courantes des RPF).
  2. Calculez les statistiques de base des ORF détectés à l’aide de RiboCode:
    Rscript RiboCode_utils. R
    REMARQUE : RiboCode_utils. R (fichier supplémentaire 3) fournit une série de statistiques pour la sortie RiboCode, par exemple, en comptant le nombre d’ORF identifiés, en visualisant la distribution des longueurs ORF et en calculant les densités RPF normalisées (c.-à-d. RPKM, lectures par kilobase par million de lectures cartographiées).

8. Visualisation (facultative) des ORF prévus

  1. Obtenez les positions relatives des codons de départ et d’arrêt pour le BLR souhaité (p. ex., ENSG00000100902_35292349_35292552_67) sur sa transcription à partir de RiboCode_ORFs_result_collapsed.txt (dossier supplémentaire 3). Ensuite, tracez la densité des lectures RPF dans l’ORF :
    plot_orf_density -a RiboCode_annot -c merged_config.txt -t ENST00000622405 \
    -s 33 -e 236 --start-codon ATG -o ENSG00000100902_35292349_35292552_67
    -s et -e spécifient la position de début et d’arrêt de la traduction du traçage orf. --start-codon définit le codon de départ de l’ORF, qui apparaîtra dans le titre de la figure. -o définit le préfixe du nom du fichier de sortie.

9. Analyse (facultative) des métagènes à l’aide de RiboMiner

REMARQUE: Effectuer l’analyse des métagènes pour évaluer l’influence de l’élimination de l’EIF3E sur la traduction des ORF annotés identifiés, en suivant les étapes ci-dessous:

  1. Générez des annotations de transcriptions pour RiboMiner, qui extrait la transcription la plus longue pour chaque gène en fonction du fichier d’annotation généré par RiboCode (étape 5.1).
    OutputTranscriptInfo -c RiboCode_annot/transcripts_cds.txt \
    -g Homo_sapiens. GRCh38.104.gtf -f RiboCode_annot/transcripts_sequence.fa \
    -o longest.transcripts.info.txt -O all.transcripts.info.txt
  2. Préparez le fichier de configuration pour RiboMiner. Copiez le fichier de configuration généré par la commande metaplots de RiboCode (étape 5.4) et renommez-le « RiboMiner_config.txt ». Ensuite, modifiez-le en fonction du format indiqué dans le fichier supplémentaire 4.
  3. Analyses de métagènes à l’aide de RiboMiner
    1. Utilisez MetageneAnalysis pour générer un profil agrégé et moyenné des densités de RPF entre les transcriptions.
      MetageneAnalysis -f RiboMiner_config.txt -c longest.transcripts.info.txt \
      -o MA_normed -U codon -M RPKM -u 100 -d 400 -l 100 -n 10 -m 1 -e 5 --norme oui \
      -y 100 --type UTR
      Où les paramètres importants sont: --type, en analysant les régions CDS ou UTR ; --norm, si la densité de lecture a été normalisée; -y, le nombre de codons utilisés pour chaque transcription ; -U, diagramme de densité RPF soit au niveau du codon , soit au niveau nt ; -u et -d, définissent la plage des régions d’analyse par rapport au codon de départ ou au codon d’arrêt ; -l, la longueur minimale (c.-à-d. le nombre de codons) du CDS; -M, le mode de filtrage des transcriptions, soit compte , soit RPKM ; -n nombre minimum ou RPKM dans le CDS pour analyse. -m nombre minimum ou RPKM de CDS dans la région normalisée; -e, le nombre de codons exclus de la région normalisée.
    2. Générez un ensemble de fichiers PDF pour comparer les occupations de ribosomes sur l’ARNm dans les cellules témoins et les cellules déficientes en eIF3.
      PlotMetageneAnalysis -i MA_normed_dataframe.txt -o MA_normed \
      -g si-Ctrl,si-eIF3e -r si-Ctrl-1,si-Ctrl-2,si-Ctrl-3__si-eIF3e-1,si-eIF3e-2,si-eIF3e-3 -u 100 -d 400 --mode moyenne
      REMARQUE : PlotMetageneAnalysis génère l’ensemble des fichiers pdf. Des détails sur l’utilisation de MetageneAnalysis et PlotMetageneAnalysis sont disponibles sur le site Web de RiboMiner30.

Résultats

Les exemples d’ensembles de données de profilage de ribosomes ont été déposés dans la base de données GEO sous le numéro d’acquisition GSE131074. Tous les fichiers et codes utilisés dans ce protocole sont disponibles à partir des fichiers supplémentaires 1 à 4. En appliquant RiboCode à un ensemble de données publiées sur le profilage des ribosomes23, nous avons identifié les nouveaux ORF activement traduits dans les cellules MCF...

Discussion

Le profilage des ribosomes offre une occasion sans précédent d’étudier l’action des ribosomes dans les cellules à l’échelle du génome. Déchiffrer précisément les informations véhiculées par les données de profilage des ribosomes pourrait donner un aperçu des régions de gènes ou de transcriptions qui se traduisent activement. Ce protocole étape par étape fournit des conseils sur la façon d’utiliser RiboCode pour analyser en détail les données de profilage des ribosomes, y compris l’installati...

Déclarations de divulgation

Les auteurs n’ont aucun conflit d’intérêts à divulguer.

Remerciements

Les auteurs tiennent à souligner le soutien des ressources informatiques fournies par la plate-forme HPCC de l’Université Xi’an Jiaotong. Z.X. remercie chaleureusement le Young Topnotch Talent Support Plan de l’Université Xi’an Jiaotong.

matériels

NameCompanyCatalog NumberComments
A computer/server running LinuxAny--
Anaconda or MinicondaAnaconda-Anaconda: https://www.anaconda.com; Miniconda:https://docs.conda.io/en/latest/miniconda.html
RR Foundation-https://www.r-project.org/
RstudioRstudio-https://www.rstudio.com/

Références

  1. Eisenberg, A. R., et al. Translation Initiation Site Profiling Reveals Widespread Synthesis of Non-AUG-Initiated Protein Isoforms in Yeast. Cell Systems. 11 (2), 145-160 (2020).
  2. Spealman, P., et al. Conserved non-AUG uORFs revealed by a novel regression analysis of ribosome profiling data. Genome Research. 28 (2), 214-222 (2018).
  3. Ingolia, N. T., Lareau, L. F., Weissman, J. S. Ribosome profiling of mouse embryonic stem cells reveals the complexity and dynamics of mammalian proteomes. Cell. 147 (4), 789-802 (2011).
  4. Bazzini, A. A., et al. Identification of small ORFs in vertebrates using ribosome footprinting and evolutionary conservation. The EMBO Journal. 33 (9), 981-993 (2014).
  5. Ingolia, N. T., et al. Ribosome profiling reveals pervasive translation outside of annotated protein-coding genes. Cell Reports. 8 (5), 1365-1379 (2014).
  6. Chew, G. L., Pauli, A., Schier, A. F. Conservation of uORF repressiveness and sequence features in mouse, human and zebrafish. Nature Communications. 7, 11663 (2016).
  7. Zhang, H., et al. Determinants of genome-wide distribution and evolution of uORFs in eukaryotes. Nature Communications. 12 (1), 1076 (2021).
  8. Guenther, U. P., et al. The helicase Ded1p controls use of near-cognate translation initiation codons in 5' UTRs. Nature. 559 (7712), 130-134 (2018).
  9. Goldsmith, J., et al. Ribosome profiling reveals a functional role for autophagy in mRNA translational control. Communications Biology. 3 (1), 388 (2020).
  10. Magny, E. G., et al. Conserved regulation of cardiac calcium uptake by peptides encoded in small open reading frames. Science. 341 (6150), 1116-1120 (2013).
  11. Stumpf, C. R., Moreno, M. V., Olshen, A. B., Taylor, B. S., Ruggero, D. The translational landscape of the mammalian cell cycle. Molecular Cell. 52 (4), 574-582 (2013).
  12. Gerashchenko, M. V., Lobanov, A. V., Gladyshev, V. N. Genome-wide ribosome profiling reveals complex translational regulation in response to oxidative stress. Proceedings of the National Academy of Sciences of the United States of America. 109 (43), 17394-17399 (2012).
  13. Andreev, D. E., et al. Oxygen and glucose deprivation induces widespread alterations in mRNA translation within 20 minutes. Genome Biology. 16, 90 (2015).
  14. Chng, S. C., Ho, L., Tian, J., Reversade, B. ELABELA: a hormone essential for heart development signals via the apelin receptor. Developmental Cell. 27 (6), 672-680 (2013).
  15. Pauli, A., et al. Toddler: an embryonic signal that promotes cell movement via Apelin receptors. Science. 343 (6172), 1248636 (2014).
  16. Stark, A., et al. Discovery of functional elements in 12 Drosophila genomes using evolutionary signatures. Nature. 450 (7167), 219-232 (2007).
  17. Lin, M. F., Jungreis, I., Kellis, M. PhyloCSF: a comparative genomics method to distinguish protein coding and non-coding regions. Bioinformatics. 27 (13), 275-282 (2011).
  18. Slavoff, S. A., et al. Peptidomic discovery of short open reading frame-encoded peptides in human cells. Nature Chemical Biology. 9 (1), 59-64 (2013).
  19. Schwaid, A. G., et al. Chemoproteomic discovery of cysteine-containing human short open reading frames. Journal of the American Chemical Society. 135 (45), 16750-16753 (2013).
  20. Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. Genome-wide annotation and quantitation of translation by ribosome profiling. Current Protocols in Molecular Biology. , 1-19 (2013).
  21. Ingolia, N. T., Ghaemmaghami, S., Newman, J. R., Weissman, J. S. Genome-wide analysis in vivo of translation with nucleotide resolution using ribosome profiling. Science. 324 (5924), 218-223 (2009).
  22. Xiao, Z., et al. De novo annotation and characterization of the translatome with ribosome profiling data. Nucleic Acids Research. 46 (10), 61 (2018).
  23. Lin, Y., et al. eIF3 Associates with 80S Ribosomes to Promote Translation Elongation, Mitochondrial Homeostasis, and Muscle Health. Molecular Cell. 79 (4), 575-587 (2020).
  24. . AGAT: Another Gff Analysis Toolkit to handle annotations in any GTF/GFF format Available from: https://agat.readthedocs.io/en/latest/gff_to_gtf.html (2020)
  25. . Gene Expression Omnibus Available from: https://www.ncbi.nim.nih.gov/geo (2002)
  26. Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. The ribosome profiling strategy for monitoring translation in vivo by deep sequencing of ribosome-protected mRNA fragments. Nature Protocols. 7 (8), 1534-1550 (2012).
  27. . STAR manual Available from: https://github.com/alexdobin/STAR/blob/master/doc/STARmanual.pdf (2022)
  28. . The genetic codes Available from: https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi (2019)
  29. . RiboMiner Available from: https://github.com/xryanglab/RiboMiner (2020)
  30. Ingolia, N. T., Hussmann, J. A., Weissman, J. S. Ribosome profiling: global views of translation. Cold Spring Harbor Perspectives in Biology. 11 (5), 032698 (2018).
  31. Lee, S., et al. Global mapping of translation initiation sites in mammalian cells at single-nucleotide resolution. Proceedings of the National Academy of Sciences of the United States of America. 109 (37), 2424-2432 (2012).
  32. Gao, X., et al. Quantitative profiling of initiating ribosomes in vivo. Nature Methods. 12 (2), 147-153 (2015).
  33. Spealman, P., Naik, A., McManus, J. uORF-seqr: A Machine Learning-Based approach to the identification of upstream open reading frames in yeast. Methods in Molecular Biol. 2252, 313-329 (2021).
  34. . RiboCode Available from: https://github.com/xryanglab/RiboCode (2018)
  35. Sharma, P., Wu, J., Nilges, B. S., Leidel, S. A. Humans and other commonly used model organisms are resistant to cycloheximide-mediated biases in ribosome profiling experiments. Nature Communications. 12 (1), 5094 (2021).

Réimpressions et Autorisations

Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE

Demande d’autorisation

Explorer plus d’articles

BiologieNum ro 180Profilage des ribosomescadre de lecture ouverttraduction de l ARNmmicropeptideuORFdORF

This article has been published

Video Coming Soon

JoVE Logo

Confidentialité

Conditions d'utilisation

Politiques

Recherche

Enseignement

À PROPOS DE JoVE

Copyright © 2025 MyJoVE Corporation. Tous droits réservés.