De novo Identificación de marcos de lectura abiertos traducidos activamente con datos de perfil de ribosomas

Yanan Zhu; Fajin Li; Xuerui Yang; Zhengtao Xiao

doi:10.3791/63366

Se requiere una suscripción a JoVE para ver este contenido. Inicie sesión o comience su prueba gratuita.

En este artículo

Resumen
Resumen
Introducción
Protocolo
Resultados
Discusión
Divulgaciones
Agradecimientos
Materiales
Referencias
Reimpresiones y Permisos

Resumen

La traducción de ribosomas decodifica tres nucleótidos por codón en péptidos. Su movimiento a lo largo del ARNm, capturado por el perfil de ribosomas, produce las huellas que exhiben una periodicidad de triplete característica. Este protocolo describe cómo usar RiboCode para descifrar esta característica prominente a partir de los datos de perfiles de ribosomas para identificar marcos de lectura abiertos traducidos activamente a nivel de transcriptoma completo.

Resumen

La identificación de marcos de lectura abiertos (ORF), especialmente aquellos que codifican pequeños péptidos y se traducen activamente en contextos fisiológicos específicos, es fundamental para las anotaciones completas de los traducomas dependientes del contexto. El perfil de ribosomas, una técnica para detectar las ubicaciones de unión y las densidades de la traducción de ribosomas en el ARN, ofrece una vía para descubrir rápidamente dónde se produce la traducción a escala de todo el genoma. Sin embargo, no es una tarea trivial en bioinformática identificar de manera eficiente y exhaustiva los ORF de traducción para el perfil de ribosomas. Aquí se describe un paquete fácil de usar, llamado RiboCode, diseñado para buscar ORF de traducción activa de cualquier tamaño a partir de señales distorsionadas y ambiguas en datos de perfiles de ribosomas. Tomando nuestro conjunto de datos publicado anteriormente como ejemplo, este artículo proporciona instrucciones paso a paso para toda la canalización de RiboCode, desde el preprocesamiento de los datos sin procesar hasta la interpretación de los archivos de resultados de salida final. Además, para evaluar las tasas de traducción de los ORF anotados, también se describen en detalle los procedimientos para la visualización y cuantificación de las densidades de ribosomas en cada ORF. En resumen, el presente artículo es una instrucción útil y oportuna para los campos de investigación relacionados con la traducción, los ORF pequeños y los péptidos.

Introducción

Recientemente, un creciente cuerpo de estudios ha revelado una producción generalizada de péptidos traducidos de ORF de genes codificantes y los genes previamente anotados como no codificantes, como los ARN no codificantes largos (lncRNA)1,2,3,4,5,6,7,8. Estos ORF traducidos son regulados o inducidos por las células para responder a los cambios ambientales, el estrés y la diferenciación celular1,8,9,10,11,12,13. Se ha demostrado que los productos de traducción de algunos ORF desempeñan importantes funciones reguladoras en diversos procesos biológicos en desarrollo y fisiología. Por ejemplo, Chng et ^al.14 descubrieron una hormona peptídica llamada Elabela (Ela, también conocida como Apela/Ende/Toddler), que es crítica para el desarrollo cardiovascular. Pauli et al. sugirieron que Ela también actúa como un mitógeno que promueve la migración celular en el embrión de peces ^tempranos15. Magny et al. reportaron dos micropéptidos de menos de 30 aminoácidos que regulan el transporte de calcio y afectan la contracción muscular regular en el corazón de ^Drosophila10.

No está claro cuántos de estos péptidos están codificados por el genoma y si son biológicamente relevantes. Por lo tanto, la identificación sistemática de estos ORF potencialmente codificantes es muy deseable. Sin embargo, determinar directamente los productos de estos ORF (es decir, proteínas o péptidos) utilizando enfoques tradicionales como la conservación ^{evolutiva16,17} y la espectrometría de ^masas18,19 es un desafío porque la eficiencia de detección de ambos enfoques depende de la longitud, abundancia y composición de aminoácidos de las proteínas o péptidos producidos. El advenimiento del perfil de ribosomas, una técnica para identificar la ocupación del ribosoma en los ARNm a resolución de nucleótidos, ha proporcionado una forma precisa de evaluar el potencial de codificación de diferentes transcripciones3,20,21, independientemente de su longitud y composición. Una característica importante y de uso frecuente para identificar ORF que traducen activamente utilizando perfiles de ribosomas es la periodicidad de tres nucleótidos (3-nt) de las huellas del ribosoma en el ARNm desde el codón de inicio hasta el codón de parada. Sin embargo, los datos de perfiles de ribosomas a menudo tienen varios problemas, incluidas las lecturas de secuenciación bajas y escasas a lo largo de los ORF, el alto ruido de secuenciación y las contaminaciones de ARN ribosómico (ARNr). Por lo tanto, las señales distorsionadas y ambiguas generadas por dichos datos debilitan los patrones de periodicidad de 3-nt de las huellas de los ribosomas en el ARNm, lo que en última instancia dificulta la identificación de los ORF traducidos de alta confianza.

Un paquete llamado "RiboCode" adaptó una prueba modificada de rango firmado por Wilcoxon y una estrategia de integración de valor P para examinar si el ORF tiene significativamente más fragmentos protegidos por ribosomas (RPF) en el marco que los RPF fuera del ^marco22. Se demostró que es altamente eficiente, sensible y preciso para la anotación de novo del traducoma en datos de perfiles de ribosomas simulados y reales. Aquí, describimos cómo usar esta herramienta para detectar el potencial de traducción de ORFs de los conjuntos de datos de secuenciación de perfiles de ribosomas en bruto generados por el estudio ^anterior23. Estos conjuntos de datos se habían utilizado para explorar la función de la subunidad EIF3 "E" (EIF3E) en la traducción mediante la comparación de los perfiles de ocupación de ribosomas de células MCF-10A transfectadas con ARN de control (si-Ctrl) y EIF3E (si-eIF3e) de interferencia pequeña (siRNAs). Al aplicar RiboCode a estos conjuntos de datos de ejemplo, detectamos 5.633 nuevos ORF que potencialmente codifican pequeños péptidos o proteínas. Estos ORF se clasificaron en varios tipos en función de sus ubicaciones en relación con las regiones codificantes, incluidos los ORF aguas arriba (uORF), los ORF aguas abajo (dORF), los ORF superpuestos, los ORF de nuevos genes codificantes de proteínas (nuevos PCG) y los ORF de nuevos genes no codificantes de proteínas (nuevos nonPCG). Las densidades de lectura de FPR en los uORF aumentaron significativamente en las células deficientes en EIF3E en comparación con las células de control, lo que podría ser causado al menos parcialmente por el enriquecimiento de ribosomas que traducen activamente. La acumulación localizada de ribosomas en la región ^{del codón} ^{25 al} 75 de células deficientes en EIF3E indicó un bloqueo de la elongación de la traducción en la etapa temprana. Este protocolo también muestra cómo visualizar la densidad de RPF de la región deseada para examinar los patrones de periodicidad de 3 nt de huellas de ribosomas en ORF identificados. Estos análisis demuestran el poderoso papel de RiboCode en la identificación de ORF de traducción y el estudio de la regulación de la traducción.

Protocolo

1. Configuración del entorno e instalación de RiboCode

Abra una ventana de terminal Linux y cree un entorno conda:
conda create -n RiboCode python=3.8
Cambie al entorno creado e instale RiboCode y dependencias:
conda activar RiboCode
conda install -c bioconda ribocode ribominer sra-tools fastx_toolkit cutadapt bowtie star samtools

2. Preparación de datos

Obtener archivos de referencia del genoma.
1. Para la secuencia de referencia, vaya al sitio web de Ensemble en https://www.ensembl.org/index.html, haga clic en el menú superior Descargar y en el menú del lado izquierdo Descargar FTP. En la tabla presentada, haga clic en FASTA en la columna ADN (FASTA) y en la fila donde Especie es Humano. En la página abierta, copie el enlace de Homo_sapiens. GRCh38.dna.primary_assembly.fa.gz, luego descárguelo y descomprímalo en el terminal:
  wget -c \
  http://ftp.ensembl.org/pub/release-104/fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz
  gzip -d Homo_sapiens. GRCh38.dna.primary_assembly.fa.gz
2. Para obtener una anotación de referencia, haga clic con el botón secundario en GTF en la columna Conjuntos de genes de la última página web abierta. Copie el enlace de Homo_sapiens. GRCh38.104.gtf.gz y descárguelo usando:
  wget -c \
  http://ftp.ensembl.org/pub/release-104/gtf/homo_sapiens/Homo_sapiens.GRCh38.104.gtf.gz
  gzip -d Homo_sapiens. GRCh38.104.gtf.gz
  NOTA: Se recomienda obtener el archivo GTF del sitio web de Ensemble, ya que contiene anotaciones del genoma organizadas en una jerarquía de tres niveles, es decir, cada gen contiene transcripciones que contienen exones y traducciones opcionales (por ejemplo, secuencias de codificación [CDS], sitio de inicio de traducción, sitio de finalización de traducción). Cuando faltan las anotaciones de un gen o transcripción, por ejemplo, un archivo GTF obtenido de UCSC o NCBI, use GTFupdate para generar un GTF actualizado con anotaciones completas de jerarquía padre-hijo: GTFupdate original.gtf > updated.gtf. Para el archivo de anotación en formato .gff, utilice el kit de herramientas ^AGAT24 o cualquier otra herramienta para convertir al formato .gtf.
Obtener secuencias de ARNr.
1. Abra UCSC Genome Browser en https://genome.ucsc.edu y haga clic en Herramientas | Explorador de tablas en la lista desplegable.
2. En la página abierta, especifique Mamífero para clado, Humano para genoma, Todas las tablas para grupo, rmask para tabla y Genoma para región. Para el filtro, haga clic en Crear para ir a una nueva página y establecer repClass como coincide con rRNA.
3. Haga clic en Enviar y, a continuación, establezca el formato de salida en secuencia y nombre de archivo de salida como hg38_rRNA.fa. Finalmente, haga clic en Obtener | de salida Obtenga la secuencia para recuperar la secuencia de ARNr.
Obtenga conjuntos de datos de perfiles de ribosomas de Sequence Read Archive (SRA).
1. Descargue las muestras replicadas del grupo de tratamiento si-eIF3e y cámbieles el nombre:
  fastq-dump SRR9047190 SRR9047191 SRR9047192
  mv SRR9047190.fastq si-eIF3e-1.fastq
  mv SRR9047191.fastq si-eIF3e-2.fastq
  mv SRR9047192.fastq si-eIF3e-3.fastq
2. Descargue los ejemplos replicados del grupo de control y cámbieles el nombre:
  fastq-dump SRR9047193 SRR9047194 SRR9047195
  mv SRR9047193.fastq si-Ctrl-1.fastq
  mv SRR9047194.fastq si-Ctrl-2.fastq
  mv SRR9047195.fastq si-Ctrl-3.fastq
  NOTA: Los ID de acceso de SRA para estos conjuntos de datos de ejemplo se obtuvieron del sitio web de Gene Expression Omnibus (GEO)²⁵ mediante la búsqueda de GSE131074.

3. Recorte los adaptadores y elimine la contaminación por ARNr

(Opcional) Quite los adaptadores de los datos de secuenciación. Omita este paso si las secuencias del adaptador ya se han recortado, como en este caso. De lo contrario, use cutadapt para recortar los adaptadores de las lecturas.
for i en si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
hacer
cutadapt -m 15 --match-read-wildcards -a CTGTAGGCACCATCAAT \
-o ${i}_trimmed.fastq ${i}.fastq
hecho
NOTA: La secuencia del adaptador después de -a parámetro variará dependiendo de la preparación de la biblioteca de CDNA. Las lecturas más cortas que 15 (dadas por -m) se descartan porque los fragmentos protegidos por ribosomas suelen ser más largos que este tamaño.
Elimine la contaminación por ARNr siguiendo estos pasos:
1. Secuencias de referencia de ARNr índice:
  bowtie-build -f hg38_rRNA.fa hg38_rRNA
2. Alinee las lecturas con la referencia de ARNr para descartar las lecturas que se originan en arNr:
  for i en si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
  hacer
  pajarita -n 0 -y -a --norc --mejor --estratos -S -p 4 -l 15 \
  --un=./${i}_noncontam.fastq hg38_rRNA -q ${i}.fastq ${i}.aln
  hecho
  -p especifica el número de subprocesos para ejecutar paralelamente las tareas. Teniendo en cuenta el tamaño relativamente pequeño de las lecturas del FPR, se deben especificar otros argumentos (por ejemplo, -n, -y, -a, -norc, --best, --strata y -l) para garantizar que las alineaciones informadas sean las mejores. Para obtener más detalles, consulte el sitio web de ^Bowtie26.

4. Alinea las lecturas limpias con el genoma

Crear un índice del genoma.
mkdir STAR_hg38_genome
STAR --runThreadN 8 --runMode genomeGenerate --genomeDir ./STAR_hg38_genome --genomeFastaFiles Homo_sapiens. GRCh38.dna.primary_assembly.fa --sjdbGTFfile Homo_sapiens. GRCh38.104.gtf
Alinee las lecturas limpias (sin contaminación por ARNr) con la referencia creada.
for i en si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
hacer
STAR --runThreadN 8 --outFilterType Normal --outWigType wiggle --outWigStrand Stranded --outWigNorm RPM --outFilterMismatchNmax 1 --outFilterMultimapNmax 1 --genomeDir STAR_hg38_genome --readFilesIn ${i}_noncontam.fastq --outFileNamePrefix ${i}. --outSAMtype BAM SortedByCoordinate --quantMode TranscriptomeSAM GeneCounts --outSAMattributes All
hecho
NOTA: Con frecuencia, la transcriptasa ^inversa27 agrega con frecuencia un nucleótido sin plantilla al extremo de 5' de cada lectura, que star recortará de manera eficiente ya que realiza el recorte suave de forma predeterminada. Los parámetros de STAR se describen en el manual ^star28.
Ordenar e indexar archivos de alineación.
for i en si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
hacer
samtools sort -T ${i}. Aligned.toTranscriptome.out.sorted \
-o ${i}. Aligned.toTranscriptome.out.sorted.bam \
${i}. Alineado.aTranscriptome.out.bam
índice samtools ${i}. Aligned.toTranscriptome.out.sorted.bam
índice samtools ${i}. Alineado.ordenadoPorCoord.out.bam
hecho

5. Selección del tamaño de los RPF e identificación de sus sitios P

Prepare las anotaciones de la transcripción.
prepare_transcripts -g Homo_sapiens. GRCh38.104.gtf \
-f Homo_sapiens. GRCh38.dna.primary_assembly.fa -o RiboCode_annot
NOTA: Este comando recopila la información requerida de las transcripciones de ARNm del archivo GTF y extrae las secuencias de todas las transcripciones de ARNm del archivo FASTA (cada transcripción se ensambla fusionando los exones de acuerdo con las estructuras definidas en el archivo GTF).
Seleccione RPF de longitudes específicas e identifique sus posiciones de sitio P.
for i en si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
hacer
metatramas -a RiboCode_annot -r ${i}. Alineado.aTranscriptome.out.bam \
-o ${i} -f0_percent 0.35 -pv1 0.001 -pv2 0.001
hecho
NOTA: Este comando traza los perfiles agregados del extremo 5' de las lecturas alineadas de cada longitud alrededor de codones de inicio (o parada) de traducción anotados. El sitio P dependiente de la longitud de lectura se puede determinar manualmente examinando las gráficas de distribución (por ejemplo, la Figura 1B) de las distancias de desplazamiento entre los extremos 5' de las lecturas principales y el codón de inicio. RiboCode también genera un archivo de configuración para cada muestra, en el que se determinan automáticamente las posiciones P-site de las lecturas que muestran patrones de periodicidad significativos de 3 nt. Los parámetros -f0_percent, -pv1 y -pv2 definen el umbral de proporción y los puntos de corte del valor p para seleccionar las lecturas RPF enriquecidas en el marco de lectura. En este ejemplo, los nucleótidos +12, +13 y +13 del extremo 5' de las lecturas de 29, 30 y 31 nt se definen manualmente en cada archivo de configuración.
Edite los archivos de configuración de cada ejemplo y combínelos
NOTA: Para generar un conjunto de consenso de ORF únicos y garantizar una cobertura suficiente de lecturas para realizar análisis posteriores, se combinan las lecturas seleccionadas de todas las muestras en el paso anterior. Las lecturas de longitudes específicas definidas en merged_config.txt archivo (Archivo suplementario 1) y su información del sitio P se utilizan para evaluar el potencial de traducción de orfs en el siguiente paso.

6. Anotación de novo traduciendo ORFs

Ejecute RiboCode.
RiboCode -a RiboCode_annot -c merged_config.txt -l sí -g \
-o RiboCode_ORFs_result -s ATG -m 5 -A CTG,GTG,TTG
Donde los parámetros importantes de este comando son los siguientes:
-c, archivo de configuración que contiene la ruta de los archivos de entrada y la información de las lecturas seleccionadas y sus sitios P.
-l, para las transcripciones que tienen múltiples codones de inicio aguas arriba de los codones de parada, si los ORF más largos (la región desde el codón de inicio más distal hasta el codón de parada) se utilizan para evaluar su potencial de traducción. Si se establece en no, los codones iniciales se determinarán automáticamente.
-s, el codón(es) de inicio canónico(s) utilizado(s) para la identificación de ORFs.
-A, (opcionalmente) los codones de inicio no canónicos (por ejemplo, CTG, GTG y TTG para humanos) utilizados para la identificación de ORF, que pueden diferir en mitocondrias o núcleos de otras ^especies29.
-m, la longitud mínima (es decir, aminoácidos) de los ORF.
-o, el prefijo del nombre de archivo de salida que contiene los detalles de los ORF predichos (Archivo suplementario 2).
-g y -b, salida de los ORF predichos a gtf o formato de cama , respectivamente.

7. (Opcional) Cuantificación y estadísticas de ORF

Contar las lecturas de RPF en cada ORF.
for i en si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
hacer
ORFcount -g RiboCode_ORFs_result_collapsed.gtf \
-r ${i}. Aligned.sortedByCoord.out.bam -f 15 -l 5 -m 25 -M 35 \
-o ${i}_ORF.counts -s sí -c intersección-estricta
hecho
NOTA: Para excluir los ribosomas potenciales acumulados alrededor del inicio y los extremos de los ORF, no se cuenta el número de lecturas asignadas en los primeros 15 (especificados por -f) y los últimos 5 codones (específicos por -l). Opcionalmente, las longitudes de los RPF contados se restringen al rango de 25 a 35 nt (tamaños comunes de RPF).
Calcule las estadísticas básicas de los ORF detectados utilizando RiboCode:
Rscript RiboCode_utils. R
NOTA: RiboCode_utils. R (Supplemental File 3) proporciona una serie de estadísticas para la salida de RiboCode, por ejemplo, contando el número de ORF identificados, viendo la distribución de longitudes de ORF y calculando las densidades de RPF normalizadas (es decir, RPKM, lecturas por kilobase por millón de lecturas mapeadas).

8. (Opcional) Visualización de los ORFs predichos

Obtenga las posiciones relativas de los codones de inicio y parada para el ORF deseado (por ejemplo, ENSG00000100902_35292349_35292552_67) en su transcripción de RiboCode_ORFs_result_collapsed.txt (Archivo suplementario 3). A continuación, trace la densidad de las lecturas de RPF en el ORF:
plot_orf_density -a RiboCode_annot -c merged_config.txt -t ENST00000622405 \
-s 33 -e 236 --start-codon ATG -o ENSG00000100902_35292349_35292552_67
Donde -s y -e especifican la posición de inicio y parada de la traducción del trazado ORF. --start-codon define el codón de inicio del ORF, que aparecerá en el título de la figura. -o define el prefijo del nombre del archivo de salida.

9. (Opcional) Análisis metagénico con RiboMiner

NOTA: Realice el análisis metagénico para evaluar la influencia del derribo de EIF3E en la traducción de los ORF anotados identificados, siguiendo los pasos a continuación:

Generar anotaciones de transcripciones para RiboMiner, que extrae la transcripción más larga para cada gen en función del archivo de anotación generado por RiboCode (paso 5.1).
OutputTranscriptInfo -c RiboCode_annot/transcripts_cds.txt \
-g Homo_sapiens. GRCh38.104.gtf -f RiboCode_annot/transcripts_sequence.fa \
-o longest.transcripts.info.txt -O all.transcripts.info.txt
Prepare el archivo de configuración para RiboMiner. Copie el archivo de configuración generado por el comando metaplots de RiboCode (paso 5.4) y cámbiele el nombre "RiboMiner_config.txt". Luego, modifíquelo de acuerdo con el formato que se muestra en el archivo suplementario 4.
Análisis metagénicos con RiboMiner
1. Utilice MetageneAnalysis para generar un perfil agregado y promediado de las densidades de RPF en todas las transcripciones.
  MetageneAnalysis -f RiboMiner_config.txt -c longest.transcripts.info.txt \
  -o MA_normed -U codón -M RPKM -u 100 -d 400 -l 100 -n 10 -m 1 -e 5 --norma sí \
  -y 100 --tipo UTR
  Donde los parámetros importantes son: --type, analizando regiones CDS o UTR ; --norma, si se normaliza la densidad de lectura; -y, el número de codones utilizados para cada transcripción; -U, trazar la densidad de RPF ya sea a nivel de codón o a nivel de nt ; -u y -d, definen el rango de regiones de análisis en relación con el codón de inicio o el codón de parada; -l, la longitud mínima (es decir, el número de codones) del CDS; -M, el modo para el filtrado de transcripciones, ya sea recuentos o RPKM; -n recuentos mínimos o RPKM en CDS para análisis. -m recuentos mínimos o RPKM de CDS en la región normalizada; -e, el número de codones excluidos de la región normalizada.
2. Generar un conjunto de archivos pdf para comparar las ocupaciones de ribosomas en ARNm en células de control y células deficientes en eIF3.
  PlotMetageneAnalysis -i MA_normed_dataframe.txt -o MA_normed \
  -g si-Ctrl,si-eIF3e -r si-Ctrl-1,si-Ctrl-2,si-Ctrl-3__si-eIF3e-1,si-eIF3e-2,si-eIF3e-3 -u 100 -d 400 --mode mean
  NOTA: PlotMetageneAnalysis genera el conjunto de archivos pdf. Los detalles sobre el uso de MetageneAnalysis y PlotMetageneAnalysis están disponibles en el sitio web de RiboMiner30.

Resultados

Los conjuntos de datos de perfiles de ribosomas de ejemplo se depositaron en la base de datos GEO con el número de acceso GSE131074. Todos los archivos y códigos utilizados en este protocolo están disponibles en los archivos complementarios 1-4. Mediante la aplicación de RiboCode a un conjunto de conjuntos de datos de perfiles de ribosomas ^publicados23, identificamos los nuevos ORF traducidos activamente en células MCF-10A tratadas con siRNAs...

Discusión

El perfil de ribosomas ofrece una oportunidad sin precedentes para estudiar la acción de los ribosomas en las células a escala genómica. Descifrar con precisión la información transportada por los datos de perfiles de ribosomas podría proporcionar información sobre qué regiones de genes o transcripciones se están traduciendo activamente. Este protocolo paso a paso proporciona orientación sobre cómo usar RiboCode para analizar los datos de perfiles de ribosomas en detalle, incluida la instalación de paquetes, ...

Divulgaciones

Los autores no tienen conflictos de intereses que revelar.

Agradecimientos

Los autores desean agradecer el apoyo de los recursos computacionales proporcionados por la plataforma HPCC de la Universidad Xi'an Jiaotong. Z.X. agradece al Plan de Apoyo al Talento Joven de Primera Categoría de la Universidad Xi'an Jiaotong.

Materiales

Name	Company	Catalog Number	Comments
A computer/server running Linux	Any	-	-
Anaconda or Miniconda	Anaconda	-	Anaconda: https://www.anaconda.com; Miniconda:https://docs.conda.io/en/latest/miniconda.html
R	R Foundation	-	https://www.r-project.org/
Rstudio	Rstudio	-	https://www.rstudio.com/

Referencias

Eisenberg, A. R., et al. Translation Initiation Site Profiling Reveals Widespread Synthesis of Non-AUG-Initiated Protein Isoforms in Yeast. Cell Systems. 11 (2), 145-160 (2020).
Spealman, P., et al. Conserved non-AUG uORFs revealed by a novel regression analysis of ribosome profiling data. Genome Research. 28 (2), 214-222 (2018).
Ingolia, N. T., Lareau, L. F., Weissman, J. S. Ribosome profiling of mouse embryonic stem cells reveals the complexity and dynamics of mammalian proteomes. Cell. 147 (4), 789-802 (2011).
Bazzini, A. A., et al. Identification of small ORFs in vertebrates using ribosome footprinting and evolutionary conservation. The EMBO Journal. 33 (9), 981-993 (2014).
Ingolia, N. T., et al. Ribosome profiling reveals pervasive translation outside of annotated protein-coding genes. Cell Reports. 8 (5), 1365-1379 (2014).
Chew, G. L., Pauli, A., Schier, A. F. Conservation of uORF repressiveness and sequence features in mouse, human and zebrafish. Nature Communications. 7, 11663 (2016).
Zhang, H., et al. Determinants of genome-wide distribution and evolution of uORFs in eukaryotes. Nature Communications. 12 (1), 1076 (2021).
Guenther, U. P., et al. The helicase Ded1p controls use of near-cognate translation initiation codons in 5' UTRs. Nature. 559 (7712), 130-134 (2018).
Goldsmith, J., et al. Ribosome profiling reveals a functional role for autophagy in mRNA translational control. Communications Biology. 3 (1), 388 (2020).
Magny, E. G., et al. Conserved regulation of cardiac calcium uptake by peptides encoded in small open reading frames. Science. 341 (6150), 1116-1120 (2013).
Stumpf, C. R., Moreno, M. V., Olshen, A. B., Taylor, B. S., Ruggero, D. The translational landscape of the mammalian cell cycle. Molecular Cell. 52 (4), 574-582 (2013).
Gerashchenko, M. V., Lobanov, A. V., Gladyshev, V. N. Genome-wide ribosome profiling reveals complex translational regulation in response to oxidative stress. Proceedings of the National Academy of Sciences of the United States of America. 109 (43), 17394-17399 (2012).
Andreev, D. E., et al. Oxygen and glucose deprivation induces widespread alterations in mRNA translation within 20 minutes. Genome Biology. 16, 90 (2015).
Chng, S. C., Ho, L., Tian, J., Reversade, B. ELABELA: a hormone essential for heart development signals via the apelin receptor. Developmental Cell. 27 (6), 672-680 (2013).
Pauli, A., et al. Toddler: an embryonic signal that promotes cell movement via Apelin receptors. Science. 343 (6172), 1248636 (2014).
Stark, A., et al. Discovery of functional elements in 12 Drosophila genomes using evolutionary signatures. Nature. 450 (7167), 219-232 (2007).
Lin, M. F., Jungreis, I., Kellis, M. PhyloCSF: a comparative genomics method to distinguish protein coding and non-coding regions. Bioinformatics. 27 (13), 275-282 (2011).
Slavoff, S. A., et al. Peptidomic discovery of short open reading frame-encoded peptides in human cells. Nature Chemical Biology. 9 (1), 59-64 (2013).
Schwaid, A. G., et al. Chemoproteomic discovery of cysteine-containing human short open reading frames. Journal of the American Chemical Society. 135 (45), 16750-16753 (2013).
Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. Genome-wide annotation and quantitation of translation by ribosome profiling. Current Protocols in Molecular Biology. , 1-19 (2013).
Ingolia, N. T., Ghaemmaghami, S., Newman, J. R., Weissman, J. S. Genome-wide analysis in vivo of translation with nucleotide resolution using ribosome profiling. Science. 324 (5924), 218-223 (2009).
Xiao, Z., et al. De novo annotation and characterization of the translatome with ribosome profiling data. Nucleic Acids Research. 46 (10), 61 (2018).
Lin, Y., et al. eIF3 Associates with 80S Ribosomes to Promote Translation Elongation, Mitochondrial Homeostasis, and Muscle Health. Molecular Cell. 79 (4), 575-587 (2020).
. AGAT: Another Gff Analysis Toolkit to handle annotations in any GTF/GFF format Available from: https://agat.readthedocs.io/en/latest/gff_to_gtf.html (2020)
. Gene Expression Omnibus Available from: https://www.ncbi.nim.nih.gov/geo (2002)
Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. The ribosome profiling strategy for monitoring translation in vivo by deep sequencing of ribosome-protected mRNA fragments. Nature Protocols. 7 (8), 1534-1550 (2012).
. STAR manual Available from: https://github.com/alexdobin/STAR/blob/master/doc/STARmanual.pdf (2022)
. The genetic codes Available from: https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi (2019)
. RiboMiner Available from: https://github.com/xryanglab/RiboMiner (2020)
Ingolia, N. T., Hussmann, J. A., Weissman, J. S. Ribosome profiling: global views of translation. Cold Spring Harbor Perspectives in Biology. 11 (5), 032698 (2018).
Lee, S., et al. Global mapping of translation initiation sites in mammalian cells at single-nucleotide resolution. Proceedings of the National Academy of Sciences of the United States of America. 109 (37), 2424-2432 (2012).
Gao, X., et al. Quantitative profiling of initiating ribosomes in vivo. Nature Methods. 12 (2), 147-153 (2015).
Spealman, P., Naik, A., McManus, J. uORF-seqr: A Machine Learning-Based approach to the identification of upstream open reading frames in yeast. Methods in Molecular Biol. 2252, 313-329 (2021).
. RiboCode Available from: https://github.com/xryanglab/RiboCode (2018)
Sharma, P., Wu, J., Nilges, B. S., Leidel, S. A. Humans and other commonly used model organisms are resistant to cycloheximide-mediated biases in ribosome profiling experiments. Nature Communications. 12 (1), 5094 (2021).

Reimpresiones y Permisos

Solicitar permiso para reutilizar el texto o las figuras de este JoVE artículos

Solicitar permiso

Explorar más artículos

Biolog a N mero 180 Perfil de ribosomas marco de lectura abierto traducci n de ARNm microp ptido uORF dORF

This article has been published

Video Coming Soon

Keep me updated:

Method Article

De novo Identificación de marcos de lectura abiertos traducidos activamente con datos de perfil de ribosomas

En este artículo

Resumen

Resumen

Introducción

Protocolo

Resultados

Discusión

Divulgaciones

Agradecimientos

Materiales

Referencias

Reimpresiones y Permisos