Se requiere una suscripción a JoVE para ver este contenido. Inicie sesión o comience su prueba gratuita.
* Estos autores han contribuido por igual
La traducción de ribosomas decodifica tres nucleótidos por codón en péptidos. Su movimiento a lo largo del ARNm, capturado por el perfil de ribosomas, produce las huellas que exhiben una periodicidad de triplete característica. Este protocolo describe cómo usar RiboCode para descifrar esta característica prominente a partir de los datos de perfiles de ribosomas para identificar marcos de lectura abiertos traducidos activamente a nivel de transcriptoma completo.
La identificación de marcos de lectura abiertos (ORF), especialmente aquellos que codifican pequeños péptidos y se traducen activamente en contextos fisiológicos específicos, es fundamental para las anotaciones completas de los traducomas dependientes del contexto. El perfil de ribosomas, una técnica para detectar las ubicaciones de unión y las densidades de la traducción de ribosomas en el ARN, ofrece una vía para descubrir rápidamente dónde se produce la traducción a escala de todo el genoma. Sin embargo, no es una tarea trivial en bioinformática identificar de manera eficiente y exhaustiva los ORF de traducción para el perfil de ribosomas. Aquí se describe un paquete fácil de usar, llamado RiboCode, diseñado para buscar ORF de traducción activa de cualquier tamaño a partir de señales distorsionadas y ambiguas en datos de perfiles de ribosomas. Tomando nuestro conjunto de datos publicado anteriormente como ejemplo, este artículo proporciona instrucciones paso a paso para toda la canalización de RiboCode, desde el preprocesamiento de los datos sin procesar hasta la interpretación de los archivos de resultados de salida final. Además, para evaluar las tasas de traducción de los ORF anotados, también se describen en detalle los procedimientos para la visualización y cuantificación de las densidades de ribosomas en cada ORF. En resumen, el presente artículo es una instrucción útil y oportuna para los campos de investigación relacionados con la traducción, los ORF pequeños y los péptidos.
Recientemente, un creciente cuerpo de estudios ha revelado una producción generalizada de péptidos traducidos de ORF de genes codificantes y los genes previamente anotados como no codificantes, como los ARN no codificantes largos (lncRNA)1,2,3,4,5,6,7,8. Estos ORF traducidos son regulados o inducidos por las células para responder a los cambios ambientales, el estrés y la diferenciación celular1,8,9,10,11,12,13. Se ha demostrado que los productos de traducción de algunos ORF desempeñan importantes funciones reguladoras en diversos procesos biológicos en desarrollo y fisiología. Por ejemplo, Chng et al.14 descubrieron una hormona peptídica llamada Elabela (Ela, también conocida como Apela/Ende/Toddler), que es crítica para el desarrollo cardiovascular. Pauli et al. sugirieron que Ela también actúa como un mitógeno que promueve la migración celular en el embrión de peces tempranos15. Magny et al. reportaron dos micropéptidos de menos de 30 aminoácidos que regulan el transporte de calcio y afectan la contracción muscular regular en el corazón de Drosophila10.
No está claro cuántos de estos péptidos están codificados por el genoma y si son biológicamente relevantes. Por lo tanto, la identificación sistemática de estos ORF potencialmente codificantes es muy deseable. Sin embargo, determinar directamente los productos de estos ORF (es decir, proteínas o péptidos) utilizando enfoques tradicionales como la conservación evolutiva16,17 y la espectrometría de masas18,19 es un desafío porque la eficiencia de detección de ambos enfoques depende de la longitud, abundancia y composición de aminoácidos de las proteínas o péptidos producidos. El advenimiento del perfil de ribosomas, una técnica para identificar la ocupación del ribosoma en los ARNm a resolución de nucleótidos, ha proporcionado una forma precisa de evaluar el potencial de codificación de diferentes transcripciones3,20,21, independientemente de su longitud y composición. Una característica importante y de uso frecuente para identificar ORF que traducen activamente utilizando perfiles de ribosomas es la periodicidad de tres nucleótidos (3-nt) de las huellas del ribosoma en el ARNm desde el codón de inicio hasta el codón de parada. Sin embargo, los datos de perfiles de ribosomas a menudo tienen varios problemas, incluidas las lecturas de secuenciación bajas y escasas a lo largo de los ORF, el alto ruido de secuenciación y las contaminaciones de ARN ribosómico (ARNr). Por lo tanto, las señales distorsionadas y ambiguas generadas por dichos datos debilitan los patrones de periodicidad de 3-nt de las huellas de los ribosomas en el ARNm, lo que en última instancia dificulta la identificación de los ORF traducidos de alta confianza.
Un paquete llamado "RiboCode" adaptó una prueba modificada de rango firmado por Wilcoxon y una estrategia de integración de valor P para examinar si el ORF tiene significativamente más fragmentos protegidos por ribosomas (RPF) en el marco que los RPF fuera del marco22. Se demostró que es altamente eficiente, sensible y preciso para la anotación de novo del traducoma en datos de perfiles de ribosomas simulados y reales. Aquí, describimos cómo usar esta herramienta para detectar el potencial de traducción de ORFs de los conjuntos de datos de secuenciación de perfiles de ribosomas en bruto generados por el estudio anterior23. Estos conjuntos de datos se habían utilizado para explorar la función de la subunidad EIF3 "E" (EIF3E) en la traducción mediante la comparación de los perfiles de ocupación de ribosomas de células MCF-10A transfectadas con ARN de control (si-Ctrl) y EIF3E (si-eIF3e) de interferencia pequeña (siRNAs). Al aplicar RiboCode a estos conjuntos de datos de ejemplo, detectamos 5.633 nuevos ORF que potencialmente codifican pequeños péptidos o proteínas. Estos ORF se clasificaron en varios tipos en función de sus ubicaciones en relación con las regiones codificantes, incluidos los ORF aguas arriba (uORF), los ORF aguas abajo (dORF), los ORF superpuestos, los ORF de nuevos genes codificantes de proteínas (nuevos PCG) y los ORF de nuevos genes no codificantes de proteínas (nuevos nonPCG). Las densidades de lectura de FPR en los uORF aumentaron significativamente en las células deficientes en EIF3E en comparación con las células de control, lo que podría ser causado al menos parcialmente por el enriquecimiento de ribosomas que traducen activamente. La acumulación localizada de ribosomas en la región del codón 25 al 75 de células deficientes en EIF3E indicó un bloqueo de la elongación de la traducción en la etapa temprana. Este protocolo también muestra cómo visualizar la densidad de RPF de la región deseada para examinar los patrones de periodicidad de 3 nt de huellas de ribosomas en ORF identificados. Estos análisis demuestran el poderoso papel de RiboCode en la identificación de ORF de traducción y el estudio de la regulación de la traducción.
1. Configuración del entorno e instalación de RiboCode
2. Preparación de datos
3. Recorte los adaptadores y elimine la contaminación por ARNr
4. Alinea las lecturas limpias con el genoma
5. Selección del tamaño de los RPF e identificación de sus sitios P
6. Anotación de novo traduciendo ORFs
7. (Opcional) Cuantificación y estadísticas de ORF
8. (Opcional) Visualización de los ORFs predichos
9. (Opcional) Análisis metagénico con RiboMiner
NOTA: Realice el análisis metagénico para evaluar la influencia del derribo de EIF3E en la traducción de los ORF anotados identificados, siguiendo los pasos a continuación:
Los conjuntos de datos de perfiles de ribosomas de ejemplo se depositaron en la base de datos GEO con el número de acceso GSE131074. Todos los archivos y códigos utilizados en este protocolo están disponibles en los archivos complementarios 1-4. Mediante la aplicación de RiboCode a un conjunto de conjuntos de datos de perfiles de ribosomas publicados23, identificamos los nuevos ORF traducidos activamente en células MCF-10A tratadas con siRNAs...
El perfil de ribosomas ofrece una oportunidad sin precedentes para estudiar la acción de los ribosomas en las células a escala genómica. Descifrar con precisión la información transportada por los datos de perfiles de ribosomas podría proporcionar información sobre qué regiones de genes o transcripciones se están traduciendo activamente. Este protocolo paso a paso proporciona orientación sobre cómo usar RiboCode para analizar los datos de perfiles de ribosomas en detalle, incluida la instalación de paquetes, ...
Los autores no tienen conflictos de intereses que revelar.
Los autores desean agradecer el apoyo de los recursos computacionales proporcionados por la plataforma HPCC de la Universidad Xi'an Jiaotong. Z.X. agradece al Plan de Apoyo al Talento Joven de Primera Categoría de la Universidad Xi'an Jiaotong.
Name | Company | Catalog Number | Comments |
A computer/server running Linux | Any | - | - |
Anaconda or Miniconda | Anaconda | - | Anaconda: https://www.anaconda.com; Miniconda:https://docs.conda.io/en/latest/miniconda.html |
R | R Foundation | - | https://www.r-project.org/ |
Rstudio | Rstudio | - | https://www.rstudio.com/ |
Solicitar permiso para reutilizar el texto o las figuras de este JoVE artículos
Solicitar permisoThis article has been published
Video Coming Soon
ACERCA DE JoVE
Copyright © 2025 MyJoVE Corporation. Todos los derechos reservados