Un abonnement à JoVE est nécessaire pour voir ce contenu. Connectez-vous ou commencez votre essai gratuit.
Method Article
* Ces auteurs ont contribué à parts égales
La traduction des ribosomes décode trois nucléotides par codon en peptides. Leur mouvement le long de l’ARNm, capturé par profilage des ribosomes, produit les empreintes présentant une périodicité caractéristique du triplet. Ce protocole décrit comment utiliser RiboCode pour déchiffrer cette caractéristique importante à partir des données de profilage des ribosomes afin d’identifier les cadres de lecture ouverts activement traduits au niveau du transcriptome entier.
L’identification des cadres de lecture ouverts (ORF), en particulier ceux codant de petits peptides et étant activement traduits dans des contextes physiologiques spécifiques, est essentielle pour des annotations complètes de translatomes dépendants du contexte. Le profilage des ribosomes, une technique permettant de détecter les emplacements de liaison et les densités de traduction des ribosomes sur l’ARN, offre un moyen de découvrir rapidement où la traduction se produit à l’échelle du génome. Cependant, ce n’est pas une tâche triviale en bioinformatique d’identifier efficacement et de manière exhaustive les ORF de traduction pour le profilage des ribosomes. Décrit ici est un paquet facile à utiliser, nommé RiboCode, conçu pour rechercher la traduction active d’ORF de toute taille à partir de signaux déformés et ambigus dans les données de profilage des ribosomes. En prenant notre jeu de données précédemment publié comme exemple, cet article fournit des instructions étape par étape pour l’ensemble du pipeline RiboCode, du prétraitement des données brutes à l’interprétation des fichiers de résultats de sortie finaux. En outre, pour évaluer les taux de traduction des ORF annotés, les procédures de visualisation et de quantification des densités de ribosomes sur chaque ORF sont également décrites en détail. En résumé, le présent article est une instruction utile et opportune pour les domaines de recherche liés à la traduction, aux petits ORF et aux peptides.
Récemment, un nombre croissant d’études a révélé une production généralisée de peptides traduits à partir d’ORF de gènes codants et des gènes précédemment annotés comme non codants, tels que les ARN longs non codants (LNCRNA)1,2,3,4,5,6,7,8. Ces ORF traduits sont régulés ou induits par les cellules pour répondre aux changements environnementaux, au stress et à la différenciation cellulaire1,8,9,10,11,12,13. Il a été démontré que les produits de traduction de certains ORF jouent un rôle réglementaire important dans divers processus biologiques de développement et de physiologie. Par exemple, Chng et al.14 ont découvert une hormone peptidique nommée Elabela (Ela, également connue sous le nom d’Apela / Ende / Toddler), qui est essentielle au développement cardiovasculaire. Pauli et al. ont suggéré qu’Ela agit également comme un mitogène qui favorise la migration cellulaire dans l’embryon de poisson précoce15. Magny et al. ont rapporté deux micropeptides de moins de 30 acides aminés régulant le transport du calcium et affectant la contraction musculaire régulière dans le cœur de la drosophile10.
On ne sait toujours pas combien de ces peptides sont codés par le génome et s’ils sont biologiquement pertinents. Par conséquent, l’identification systématique de ces ORF potentiellement codants est hautement souhaitable. Cependant, il est difficile de déterminer directement les produits de ces ORF (c.-à-d. protéines ou peptides) à l’aide d’approches traditionnelles telles que la conservation évolutive16,17 et la spectrométrie de masse18,19, car l’efficacité de détection des deux approches dépend de la longueur, de l’abondance et de la composition en acides aminés des protéines ou des peptides produits. L’avènement du profilage des ribosomes, une technique permettant d’identifier l’occupation des ribosomes sur les ARNm à résolution nucléotidique, a fourni un moyen précis d’évaluer le potentiel codant de différents transcripts3,20,21, indépendamment de leur longueur et de leur composition. Une caractéristique importante et fréquemment utilisée pour identifier la traduction active des ORF à l’aide du profilage des ribosomes est la périodicité à trois nucléotides (3-nt) des empreintes du ribosome sur l’ARNm, du codon de départ au codon d’arrêt. Cependant, les données de profilage des ribosomes présentent souvent plusieurs problèmes, notamment des lectures de séquençage faibles et clairsemées le long des ORF, un bruit de séquençage élevé et des contaminations par l’ARN ribosomique (ARNr). Ainsi, les signaux déformés et ambigus générés par de telles données affaiblissent les modèles de périodicité 3-nt des empreintes des ribosomes sur l’ARNm, ce qui rend finalement difficile l’identification des ORF traduits à haut degré de confiance.
Un package nommé « RiboCode » a adapté un test de rang signé Wilcoxon modifié et une stratégie d’intégration de la valeur P pour examiner si l’ORF a significativement plus de fragments protégés par ribosomes (RPF) dans le cadre que les RPF hors cadre22. Il a été démontré qu’il était très efficace, sensible et précis pour l’annotation de novo du translatome dans des données de profilage de ribosomes simulées et réelles. Ici, nous décrivons comment utiliser cet outil pour détecter les ORF de traduction potentiels à partir des ensembles de données de séquençage de profilage de ribosomes bruts générés par l’étude précédente23. Ces ensembles de données avaient été utilisés pour explorer la fonction de la sous-unité EIF3 « E » (EIF3E) en traduction en comparant les profils d’occupation des ribosomes des cellules MCF-10A transfectées avec des ARN témoins (si-Ctrl) et EIF3E (si-eIF3e) à faible interférence (siARN). En appliquant RiboCode à ces exemples d’ensembles de données, nous avons détecté 5 633 nouveaux ORF codant potentiellement de petits peptides ou protéines. Ces ORF ont été classés en différents types en fonction de leur emplacement par rapport aux régions codantes, y compris les ORF en amont (uORF), les ORF en aval (dORF), les ORF superposés, les ORF provenant de nouveaux gènes codant pour les protéines (nouveaux PCG) et les ORF de nouveaux gènes non codant pour les protéines (nouveaux nonCPC). Les densités de lecture du FPR sur les uORF ont été significativement augmentées dans les cellules déficientes en EIF3E par rapport aux cellules témoins, ce qui pourrait être au moins partiellement causé par l’enrichissement des ribosomes à traduction active. L’accumulation localisée de ribosomes dans la région du 25e au 75e codon de cellules déficientes en EIF3E indiquait un blocage de l’allongement de la traduction au stade précoce. Ce protocole montre également comment visualiser la densité RPF de la région souhaitée pour examiner les modèles de périodicité 3-nt des empreintes de ribosomes sur les ORF identifiés. Ces analyses démontrent le rôle puissant de RiboCode dans l’identification de la traduction des ORF et l’étude de la régulation de la traduction.
1. Configuration de l’environnement et installation de RiboCode
2. Préparation des données
3. Coupez les adaptateurs et éliminez la contamination par l’ARNr
4. Aligner les lectures propres sur le génome
5. Sélection de la taille des RPF et identification de leurs sites P
6. Annoter de novo la traduction des ORF
7. Quantification et statistiques du BLR (facultatif)
8. Visualisation (facultative) des ORF prévus
9. Analyse (facultative) des métagènes à l’aide de RiboMiner
REMARQUE: Effectuer l’analyse des métagènes pour évaluer l’influence de l’élimination de l’EIF3E sur la traduction des ORF annotés identifiés, en suivant les étapes ci-dessous:
Les exemples d’ensembles de données de profilage de ribosomes ont été déposés dans la base de données GEO sous le numéro d’acquisition GSE131074. Tous les fichiers et codes utilisés dans ce protocole sont disponibles à partir des fichiers supplémentaires 1 à 4. En appliquant RiboCode à un ensemble de données publiées sur le profilage des ribosomes23, nous avons identifié les nouveaux ORF activement traduits dans les cellules MCF...
Le profilage des ribosomes offre une occasion sans précédent d’étudier l’action des ribosomes dans les cellules à l’échelle du génome. Déchiffrer précisément les informations véhiculées par les données de profilage des ribosomes pourrait donner un aperçu des régions de gènes ou de transcriptions qui se traduisent activement. Ce protocole étape par étape fournit des conseils sur la façon d’utiliser RiboCode pour analyser en détail les données de profilage des ribosomes, y compris l’installati...
Les auteurs n’ont aucun conflit d’intérêts à divulguer.
Les auteurs tiennent à souligner le soutien des ressources informatiques fournies par la plate-forme HPCC de l’Université Xi’an Jiaotong. Z.X. remercie chaleureusement le Young Topnotch Talent Support Plan de l’Université Xi’an Jiaotong.
Name | Company | Catalog Number | Comments |
A computer/server running Linux | Any | - | - |
Anaconda or Miniconda | Anaconda | - | Anaconda: https://www.anaconda.com; Miniconda:https://docs.conda.io/en/latest/miniconda.html |
R | R Foundation | - | https://www.r-project.org/ |
Rstudio | Rstudio | - | https://www.rstudio.com/ |
Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE
Demande d’autorisationThis article has been published
Video Coming Soon