De novo Идентификация активно транслируемых открытых кадров чтения с данными профилирования рибосом

Yanan Zhu; Fajin Li; Xuerui Yang; Zhengtao Xiao

doi:10.3791/63366

АВТОРЫ

СВЯЖИТЕСЬ С НАМИ

Войдите в систему

Для просмотра этого контента требуется подписка на Jove Войдите в систему или начните бесплатную пробную версию.

Method Article

De novo Идентификация активно транслируемых открытых кадров чтения с данными профилирования рибосом

DOI:

10.3791/63366

⸱

February 18th, 2022

Yanan Zhu*¹, Fajin Li*²^,³, Xuerui Yang²^,³, Zhengtao Xiao¹

¹School of Basic Medical Sciences, Xi’an Jiaotong University Health Science Center, ²MOE Key Laboratory of Bioinformatics, Center for Synthetic and Systems Biology, School of Life Sciences, Tsinghua University, ³Joint Graduate Program of Peking-Tsinghua-National Institute of Biological Science

* Эти авторы внесли равный вклад

Please note that all translations are automatically generated. Click here for the English version.

Резюме

Перевод рибосом декодирует три нуклеотида на кодон в пептиды. Их движение вдоль мРНК, захваченное профилированием рибосом, производит следы, проявляющие характерную триплетную периодичность. Этот протокол описывает, как использовать RiboCode для расшифровки этой важной функции из данных профилирования рибосом для идентификации активно транслируемых открытых кадров чтения на уровне всего транскриптома.

Аннотация

Идентификация открытых кадров чтения (ORF), особенно тех, которые кодируют небольшие пептиды и активно переводятся в конкретных физиологических контекстах, имеет решающее значение для комплексных аннотаций контекстно-зависимых транслейломов. Профилирование рибосом, метод обнаружения мест связывания и плотностей трансляции рибосом на РНК, предлагает способ быстро обнаружить, где происходит трансляция в масштабе всего генома. Тем не менее, в биоинформатике не является тривиальной задачей эффективно и всесторонне идентифицировать переводящие ORF для профилирования рибосом. Здесь описан простой в использовании пакет под названием RiboCode, предназначенный для поиска активного перевода ORF любого размера из искаженных и неоднозначных сигналов в данных профилирования рибосом. Взяв в качестве примера наш ранее опубликованный набор данных, в этой статье приведены пошаговые инструкции для всего конвейера RiboCode, от предварительной обработки необработанных данных до интерпретации конечных выходных файлов результатов. Кроме того, для оценки скорости трансляции аннотированных ORF также подробно описаны процедуры визуализации и количественной оценки плотностей рибосом на каждом ORF. Таким образом, настоящая статья является полезной и своевременной инструкцией для областей исследований, связанных с переводом, малыми ОРФ и пептидами.

Введение

В последнее время растущее количество исследований выявило широко распространенную продукцию пептидов, переведенных из ORF кодирующих генов и ранее аннотированных генов как некодирующих, таких как длинные некодирующие РНК (lncRNAs)1,2,3,4,5,6,7,8. Эти переведенные ORF регулируются или индуцируются клетками для реагирования на изменения окружающей среды, стресс и дифференцировку клеток1,8,9,10,11,12,13. Было продемонстрировано, что продукты трансляции некоторых ORF играют важную регулирующую роль в различных биологических процессах развития и физиологии. Например, Chng et ^al.14 обнаружили пептидный гормон под названием Elabela (Ela, также известный как Apela/Ende/Toddler), который имеет решающее значение для развития сердечно-сосудистой системы. Паули и др. предположили, что Эла также действует как митоген, который способствует миграции клеток в раннем эмбрионе ^рыбы15. Magny et al. сообщили о двух микропептидах менее 30 аминокислот, регулирующих транспорт кальция и влияющих на регулярное сокращение мышц в сердце ^Drosophila10.

Остается неясным, сколько таких пептидов кодируется геномом и являются ли они биологически значимыми. Поэтому систематическая идентификация этих потенциально кодирующих ORF очень желательна. Однако непосредственное определение продуктов этих ORF (т.е. белка или пептида) с использованием традиционных подходов, таких как эволюционное ^{сохранение16,17} и масс-спектрометрия18,19^, является сложной задачей, поскольку эффективность обнаружения обоих подходов зависит от длины, обилия и аминокислотного состава продуцируемых белков или пептидов. Появление рибосомного профилирования, метода идентификации занятости рибосом на мРНК при нуклеотидном разрешении, обеспечило точный способ оценки кодирующего потенциала различных транскриптов3,20,21, независимо от их длины и состава. Важной и часто используемой особенностью для идентификации активно транслируемых ОРФ с использованием рибосомного профилирования является трехнуклеотидная (3-nt) периодичность следов рибосомы на мРНК от начального кодона до стоп-кодона. Тем не менее, данные профилирования рибосом часто имеют несколько проблем, включая низкие и разреженные показания секвенирования вдоль ORF, высокий шум секвенирования и загрязнение рибосомальной РНК (рРНК). Таким образом, искаженные и неоднозначные сигналы, генерируемые такими данными, ослабляют паттерны периодичности 3-х нт следов рибосом на мРНК, что в конечном итоге затрудняет идентификацию высокодоверных транслируемых ORF.

Пакет под названием «RiboCode» адаптировал модифицированный тест Wilcoxon-signed-rank и стратегию интеграции P-value, чтобы проверить, имеет ли ORF значительно больше фрагментов, защищенных рибосомами (RPF), чем внекадровые ^RPF22. Было продемонстрировано, что он является высокоэффективным, чувствительным и точным для de novo аннотации транслейтома в смоделированных и реальных данных профилирования рибосом. Здесь мы описываем, как использовать этот инструмент для обнаружения потенциального перевода ORF из необработанных наборов данных секвенирования профилирования рибосом, сгенерированных предыдущим ^{исследованием23}. Эти наборы данных были использованы для изучения функции субъединицы EIF3 «E» (EIF3E) в трансляции путем сравнения профилей занятости рибосом клеток MCF-10A, трансфектированных контрольными (si-Ctrl) и EIF3E (si-eIF3e) малоинтерферирующими РНК (siRNAs). Применив RiboCode к этим примерам наборов данных, мы обнаружили 5 633 новых ORF, потенциально кодирующих небольшие пептиды или белки. Эти ORF были классифицированы на различные типы в зависимости от их местоположения относительно кодирующих областей, включая вышестоящие ORF (uORFs), нижестоящие ORF (dORFs), перекрывающиеся ORF, ORF из новых генов, кодирующих белки (новые PCG), и ORF из новых генов, не вызывающих рост (новые NonPCG). Плотность считывания RPF на uORF была значительно увеличена в клетках с дефицитом EIF3E по сравнению с контрольными клетками, что может быть, по крайней мере, частично вызвано обогащением активно транслицирующихся рибосом. Локализованное накопление рибосом в области от ^25-го по ^75-й кодон EIF3E-дефицитных клеток указывало на блокировку удлинения трансляции на ранней стадии. Этот протокол также показывает, как визуализировать плотность RPF в желаемой области для изучения паттернов периодичности 3-nt следов рибосом на идентифицированных ORF. Эти анализы демонстрируют мощную роль RiboCode в выявлении переводческих ORF и изучении регулирования перевода.

Access restricted. Please log in or start a trial to view this content.

протокол

1. Настройка среды и установка RiboCode

Откройте окно терминала Linux и создайте среду conda:
conda create -n RiboCode python=3.8
Переключитесь на созданную среду и установите RiboCode и зависимости:
conda активировать RiboCode
conda install -c биоконда рибокод рибоминер sra-tools fastx_toolkit cutadapt bowtie star samtools

2. Подготовка данных

Получите справочные файлы генома.
1. Для эталонной последовательности перейдите на веб-сайт Ensemble по адресу https://www.ensembl.org/index.html, щелкните верхнее меню Загрузить и левое боковое меню FTP Download. В представленной таблице щелкните FASTA в столбце ДНК (FASTA) и строке, где Вид — Человек. На открывшейся странице скопируйте ссылку на Homo_sapiens. GRCh38.dna.primary_assembly.fa.gz, затем скачайте и распакуйте его в терминале:
  wget -c \
  http://ftp.ensembl.org/pub/release-104/fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz
  gzip -d Homo_sapiens. GRCh38.dna.primary_assembly.фа.gz
2. Для справочной аннотации щелкните правой кнопкой мыши GTF в столбце Наборы генов на последней открывшейся веб-странице. Скопируйте ссылку на Homo_sapiens. GRCh38.104.gtf.gz и загрузите его с помощью:
  wget -c \
  http://ftp.ensembl.org/pub/release-104/gtf/homo_sapiens/Homo_sapiens.GRCh38.104.gtf.gz
  gzip -d Homo_sapiens. ГРЧ38.104.gtf.gz
  ПРИМЕЧАНИЕ: Рекомендуется получить файл GTF с веб-сайта Ensemble, поскольку он содержит аннотации генома, организованные в трехуровневую иерархию, то есть каждый ген содержит транскрипты, которые содержат экзоны и необязательные переводы (например, последовательности кодирования [CDS], сайт начала перевода, конечный сайт перевода). Если аннотации гена или транскрипта отсутствуют, например, файл GTF, полученный из UCSC или NCBI, используйте GTFupdate для создания обновленного GTF с полными аннотациями иерархии родитель-потомок: GTFupdate original.gtf > updated.gtf. Для файла аннотации в формате .gff используйте AGAT ^toolkit24 или любой другой инструмент для преобразования в формат .gtf.
Получение последовательностей рРНК.
1. Откройте браузер генома UCSC в https://genome.ucsc.edu и нажмите Инструменты | Обозреватель таблиц в раскрывающемся списке.
2. На открывшейся странице укажите Mammal для клады, Human для генома, All Tables для группы, rmask для таблицы и genome для региона. Для фильтра нажмите кнопку Создать , чтобы перейти на новую страницу и задать repClass так, как соответствует rRNA.
3. Нажмите кнопку Отправить , а затем задайте для выходного формата последовательность и имя выходного файла hg38_rRNA.fa. Наконец, щелкните Получить выходной | Получение последовательности для извлечения последовательности рРНК.
Получите наборы данных профилирования рибосом из архива чтения последовательностей (SRA).
1. Скачайте реплицированные образцы группы лечения si-eIF3e и переименуйте их:
  fastq-dump SRR9047190 SRR9047191 SRR9047192
  mv SRR9047190.fastq si-eIF3e-1.fastq
  mv SRR9047191.fastq si-eIF3e-2.fastq
  mv SRR9047192.fastq si-eIF3e-3.fastq
2. Скачайте реплицированные образцы контрольной группы и переименуйте их:
  fastq-dump SRR9047193 SRR9047194 SRR9047195
  mv SRR9047193.fastq si-Ctrl-1.fastq
  mv SRR9047194.fastq si-Ctrl-2.fastq
  mv SRR9047195.fastq si-Ctrl-3.fastq
  ПРИМЕЧАНИЕ: Идентификаторы присоединения к SRA для этих примеров наборов данных были получены с веб-сайта Gene Expression Omnibus (GEO)²⁵ путем поиска GSE131074.

3. Обрежьте адаптеры и удалите загрязнение рРНК

(Необязательно) Удалите адаптеры из данных виртуализации. Пропустите этот шаг, если последовательности адаптеров уже были обрезаны, как в этом случае. В противном случае используйте cutadapt для обрезки адаптеров от чтения.
для i в si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
делать
cutadapt -m 15 --match-read-wildcards -a CTGTAGGCACCATCAAT \
-o ${i}_trimmed.fastq ${i}.fastq
Договорились
ПРИМЕЧАНИЕ: Последовательность адаптера после параметра -a будет варьироваться в зависимости от подготовки библиотеки кДНК. Показания короче 15 (заданные -m) отбрасываются, потому что фрагменты, защищенные рибосомами, обычно длиннее этого размера.
Удалите загрязнение рРНК с помощью следующих шагов:
1. Индекс референсных последовательностей рРНК:
  галстук-бабочка -f hg38_rRNA.fa hg38_rRNA
2. Выровняйте показания со ссылкой на рРНК, чтобы исключить чтения, исходящие из рРНК:
  для i в si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
  делать
  бабочка -n 0 -y -a --norc --best --strata -S -p 4 -l 15 \
  --un=./${i}_noncontam.fastq hg38_rRNA -q ${i}.fastq ${i}.aln
  Договорились
  -p указывает количество потоков для параллельного выполнения задач. Учитывая относительно небольшой размер показаний РПФ, следует указать другие аргументы (например, -n, -y, -a, -norc, --best, --strata и -l), чтобы гарантировать, что сообщаемые выравнивания являются наилучшими. Для получения более подробной информации обратитесь к веб-сайту ^Bowtie26.

4. Выровняйте чистые показания по геному

Создайте индекс генома.
мкдир STAR_hg38_genome
STAR --runThreadN 8 --runMode genomeGenerate --genomeDir ./STAR_hg38_genome --genomeFastaFiles Homo_sapiens. GRCh38.dna.primary_assembly.fa --sjdbGTFfile Homo_sapiens. ГРЧ38.104.gtf
Выровняйте чистые показания (без загрязнения рРНК) по созданному эталону.
для i в si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
делать
STAR --runThreadN 8 --outFilterType Normal --outWigType wiggle --outWigStrand Stranded --outWigNorm RPM --outFilterMismatchNmax 1 --outFilterMultimapNmax 1 --genomeDir STAR_hg38_genome --readFilesIn ${i}_noncontam.fastq --outFileNamePrefix ${i}. --outSAMtype BAM SortedByCoordinate --quantMode TranscriptomeSAM GeneCounts --outSAMattributes All
Договорились
ПРИМЕЧАНИЕ: Нешаблонный нуклеотид часто добавляется к 5'-концу каждого чтения обратной транскриптазой27, которая будет эффективно обрезана STAR, поскольку она выполняет мягкую обрезку по умолчанию. Параметры star описаны в руководстве ^STAR28.
Файлы сортировки и выравнивания индексов.
для i в si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
делать
samtools sort -T ${i}. Aligned.toTranscriptome.out.sorted \
-o ${i}. Aligned.toTranscriptome.out.sorted.bam \
${i}. Aligned.toTranscriptome.out.bam
индекс samtools ${i}. Aligned.toTranscriptome.out.sorted.bam
индекс samtools ${i}. Выровненный.сортированныйByCoord.out.bam
Договорились

5. Подбор размеров РПФ и идентификация их Р-сайтов

Подготовьте аннотации стенограммы.
prepare_transcripts -g Homo_sapiens. ГРЧ38.104.gtf \
-ф Homo_sapiens. GRCh38.dna.primary_assembly.fa -o RiboCode_annot
ПРИМЕЧАНИЕ: Эта команда собирает необходимую информацию о транскриптах мРНК из файла GTF и извлекает последовательности для всех транскриптов мРНК из файла FASTA (каждая расшифровка собирается путем слияния экзонов в соответствии со структурами, определенными в файле GTF).
Выберите RPF определенной длины и определите их позиции на P-сайте.
для i в si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
делать
metaplots -a RiboCode_annot -r ${i}. Aligned.toTranscriptome.out.bam \
-o ${i} -f0_percent 0.35 -pv1 0.001 -pv2 0.001
Договорились
ПРИМЕЧАНИЕ: Эта команда строит агрегированные профили 5' конца выровненных чтений каждой длины вокруг аннотированных кодонов начала (или остановки) перевода. P-сайт, зависящий от длины считывания, может быть определен вручную путем изучения графиков распределения (например, рисунок 1B) расстояний смещения между 5' концами основных считываний и начальным кодоном. RiboCode также генерирует конфигурационный файл для каждого образца, в котором автоматически определяются позиции P-сайта считывания, отображающие значительные шаблоны периодичности 3-nt. Параметры -f0_percent, -pv1 и -pv2 определяют пороговое значение пропорции и отсечки p-значения для выбора считывания RPF, обогащенного в кадре чтения. В этом примере нуклеотиды +12, +13 и +13 из 5' конца 29, 30 и 31 nt считываются вручную в каждом конфигурационном файле.
Редактирование файлов конфигурации для каждого примера и их объединение
ПРИМЕЧАНИЕ: Для создания консенсусного набора уникальных ORF и обеспечения достаточного охвата считываний для выполнения последующего анализа выбранные чтения всех образцов на предыдущем шаге объединяются. Считывания определенной длины, определенной в файле merged_config.txt (дополнительный файл 1), и их информация о P-сайте используются для оценки потенциала перевода ORF на следующем этапе.

6. De novo annotate перевод ORF

Запустите RiboCode.
РибоКод -a RiboCode_annot -c merged_config.txt -l yes -g \
-o RiboCode_ORFs_result -s ATG -m 5 -A CTG,GTG,TTG
Если важные параметры этой команды следующие:
-c, конфигурационный файл, содержащий путь к входным файлам и информацию о выбранных чтениях и их P-сайтах.
-l, для транскриптов, имеющих несколько стартовых кодонов выше по течению от стоп-кодонов, используются ли для оценки их переводного потенциала самые длинные ORF (область от самого дистального стартового кодона до стоп-кодона). Если задано значение нет, начальные кодоны будут определены автоматически.
-s, канонический стартовый кодон(ы), используемый для идентификации ORF.
-A, (необязательно) неканонические стартовые кодоны (например, CTG, GTG и TTG для человека), используемые для идентификации ORF, которые могут отличаться в митохондриях или ядре других ^видов29.
-m, минимальная длина (т.е. аминокислот) ОВФ.
-o, префикс имени выходного файла, содержащий сведения о прогнозируемых ORFs (Дополнительный файл 2).
-g и -b, вывод прогнозируемых ORF в формат gtf или bed соответственно.

7. (Необязательно) количественная оценка и статистика ORF

Подсчет RPF считывает в каждом ORF.
для i в si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
делать
ORFcount -g RiboCode_ORFs_result_collapsed.gtf \
-r ${i}. Aligned.sortedByCoord.out.bam -f 15 -l 5 -m 25 -M 35 \
-o ${i}_ORF.counts -s yes -c пересечение-строгое
Договорились
ПРИМЕЧАНИЕ: Чтобы исключить потенциально накапливающиеся рибосомы вокруг начала и конца ORF, количество считываний, выделенных в первых 15 ( указанных -f) и последних 5 кодонах (специфичных по -l), не учитывается. Опционально длины подсчитанных RPF ограничены диапазоном от 25 до 35 нт (общие размеры RPF).
Рассчитайте базовую статистику обнаруженных ORF с помощью RiboCode:
Rscript RiboCode_utils. R
ПРИМЕЧАНИЕ: RiboCode_utils. R (Дополнительный файл 3) предоставляет ряд статистических данных для выходных данных RiboCode, например, подсчет количества идентифицированных ORF, просмотр распределения длин ORF и вычисление нормализованных плотностей RPF (т.е. RPKM, считывание на килобазу на миллион сопоставленных чтений).

8. (Необязательно) Визуализация прогнозируемых ORF

Получить относительные положения кодонов старта и остановки для требуемого ORF (например, ENSG00000100902_35292349_35292552_67) на его расшифровке из RiboCode_ORFs_result_collapsed.txt (Дополнительный файл 3). Затем график плотности RPF читается в ORF:
plot_orf_density -a RiboCode_annot -c merged_config.txt -t ENST00000622405 \
-s 33 -e 236 --старт-кодон ATG -o ENSG00000100902_35292349_35292552_67
Где -s и -e указывают начальную и конечную позицию перевода построения ORF. --start-codon определяет стартовый кодон ORF, который появится в заголовке рисунка. -o определяет префикс имени выходного файла.

9. (Необязательно) Анализ метагенов с помощью RiboMiner

ПРИМЕЧАНИЕ: Выполните анализ метагенов для оценки влияния нокдауна EIF3E на трансляцию идентифицированных аннотированных ORF, выполнив следующие шаги:

Генерируйте аннотации транскриптов для RiboMiner, который извлекает самый длинный транскрипт для каждого гена на основе файла аннотации, сгенерированного RiboCode (шаг 5.1).
OutputTranscriptInfo -c RiboCode_annot/transcripts_cds.txt \
-г Homo_sapiens. ГРЧ38.104.gtf -ф RiboCode_annot/transcripts_sequence.фа \
-o longest.transcripts.info.txt -O all.transcripts.info.txt
Подготовьте конфигурационный файл для RiboMiner. Скопируйте конфигурационный файл, сгенерированный командой metaplots в RiboCode (шаг 5.4), и переименуйте его в "RiboMiner_config.txt". Затем измените его в соответствии с форматом, показанным в дополнительном файле 4.
Анализ метагенов с помощью RiboMiner
1. Используйте MetageneAnalysis для создания агрегированного и усредненного профиля плотностей RPF по транскриптам.
  MetageneAnalysis -f RiboMiner_config.txt -c longest.transcripts.info.txt \
  -o MA_normed -U кодон -M RPKM -u 100 -d 400 -l 100 -n 10 -m 1 -e 5 --норма да \
  -y 100 --тип UTR
  Если важными параметрами являются: --type, анализ регионов CDS или UTR ; --норма, нормализуется ли плотность считывания; -y, количество кодонов, используемых для каждой стенограммы; -U, плотность графика RPF либо на уровне кодона, либо на уровне nt ; -u и -d, определяют диапазон анализирующих областей относительно стартового кодона или стоп-кодона; -l, минимальная длина (т.е. количество кодонов) CDS; -M, режим фильтрации транскриптов, либо счетчиков , либо RPKM; -n минимальных подсчетов или RPKM в CDS для анализа. -m минимальное количество или RPKM CDS в нормализованной области; -e, количество кодонов, исключенных из нормализованной области.
2. Сгенерировать набор pdf-файлов для сравнения оккупантности рибосом на мРНК в контрольных клетках и клетках с дефицитом eIF3.
  PlotMetageneАнализ -i MA_normed_dataframe.txt -o MA_normed \
  -g si-Ctrl,si-eIF3e -r si-Ctrl-1,si-Ctrl-2,si-Ctrl-3__si-eIF3e-1,si-eIF3e-2,si-eIF3e-3 -u 100 -d 400 --mode среднее
  ПРИМЕЧАНИЕ: PlotMetageneAnalysis генерирует набор pdf-файлов. Подробная информация об использовании MetageneAnalysis и PlotMetageneAnalysis доступна на сайте RiboMiner30.

Access restricted. Please log in or start a trial to view this content.

Результаты

Примеры наборов данных профилирования рибосом были депонированы в базе данных ГЭП под номером присоединения GSE131074. Все файлы и коды, используемые в этом протоколе, доступны из дополнительных файлов 1-4. Применяя RiboCode к набору опубликованных наборов данных про...

Access restricted. Please log in or start a trial to view this content.

Обсуждение

Профилирование рибосом дает беспрецедентную возможность изучить действие рибосом в клетках в масштабе генома. Точная расшифровка информации, переносимой данными профилирования рибосом, может дать представление о том, какие области генов или транскриптов активно транслируются. Этот ...

Access restricted. Please log in or start a trial to view this content.

Раскрытие информации

У авторов нет конфликта интересов для раскрытия.

Благодарности

Авторы хотели бы отметить поддержку со стороны вычислительных ресурсов, предоставляемых платформой HPCC Сианьского университета Цзяотун. Z.X. благодарит План поддержки талантов Young Topnotch Сианьского университета Цзяотун.

Access restricted. Please log in or start a trial to view this content.

Материалы

Name	Company	Catalog Number	Comments
A computer/server running Linux	Any	-	-
Anaconda or Miniconda	Anaconda	-	Anaconda: https://www.anaconda.com; Miniconda:https://docs.conda.io/en/latest/miniconda.html
R	R Foundation	-	https://www.r-project.org/
Rstudio	Rstudio	-	https://www.rstudio.com/

Ссылки

Eisenberg, A. R., et al. Translation Initiation Site Profiling Reveals Widespread Synthesis of Non-AUG-Initiated Protein Isoforms in Yeast. Cell Systems. 11 (2), 145-160 (2020).
Spealman, P., et al. Conserved non-AUG uORFs revealed by a novel regression analysis of ribosome profiling data. Genome Research. 28 (2), 214-222 (2018).
Ingolia, N. T., Lareau, L. F., Weissman, J. S. Ribosome profiling of mouse embryonic stem cells reveals the complexity and dynamics of mammalian proteomes. Cell. 147 (4), 789-802 (2011).
Bazzini, A. A., et al. Identification of small ORFs in vertebrates using ribosome footprinting and evolutionary conservation. The EMBO Journal. 33 (9), 981-993 (2014).
Ingolia, N. T., et al. Ribosome profiling reveals pervasive translation outside of annotated protein-coding genes. Cell Reports. 8 (5), 1365-1379 (2014).
Chew, G. L., Pauli, A., Schier, A. F. Conservation of uORF repressiveness and sequence features in mouse, human and zebrafish. Nature Communications. 7, 11663(2016).
Zhang, H., et al. Determinants of genome-wide distribution and evolution of uORFs in eukaryotes. Nature Communications. 12 (1), 1076(2021).
Guenther, U. P., et al. The helicase Ded1p controls use of near-cognate translation initiation codons in 5' UTRs. Nature. 559 (7712), 130-134 (2018).
Goldsmith, J., et al. Ribosome profiling reveals a functional role for autophagy in mRNA translational control. Communications Biology. 3 (1), 388(2020).
Magny, E. G., et al. Conserved regulation of cardiac calcium uptake by peptides encoded in small open reading frames. Science. 341 (6150), 1116-1120 (2013).
Stumpf, C. R., Moreno, M. V., Olshen, A. B., Taylor, B. S., Ruggero, D. The translational landscape of the mammalian cell cycle. Molecular Cell. 52 (4), 574-582 (2013).
Gerashchenko, M. V., Lobanov, A. V., Gladyshev, V. N. Genome-wide ribosome profiling reveals complex translational regulation in response to oxidative stress. Proceedings of the National Academy of Sciences of the United States of America. 109 (43), 17394-17399 (2012).
Andreev, D. E., et al. Oxygen and glucose deprivation induces widespread alterations in mRNA translation within 20 minutes. Genome Biology. 16, 90(2015).
Chng, S. C., Ho, L., Tian, J., Reversade, B. ELABELA: a hormone essential for heart development signals via the apelin receptor. Developmental Cell. 27 (6), 672-680 (2013).
Pauli, A., et al. Toddler: an embryonic signal that promotes cell movement via Apelin receptors. Science. 343 (6172), 1248636(2014).
Stark, A., et al. Discovery of functional elements in 12 Drosophila genomes using evolutionary signatures. Nature. 450 (7167), 219-232 (2007).
Lin, M. F., Jungreis, I., Kellis, M. PhyloCSF: a comparative genomics method to distinguish protein coding and non-coding regions. Bioinformatics. 27 (13), 275-282 (2011).
Slavoff, S. A., et al. Peptidomic discovery of short open reading frame-encoded peptides in human cells. Nature Chemical Biology. 9 (1), 59-64 (2013).
Schwaid, A. G., et al. Chemoproteomic discovery of cysteine-containing human short open reading frames. Journal of the American Chemical Society. 135 (45), 16750-16753 (2013).
Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. Genome-wide annotation and quantitation of translation by ribosome profiling. Current Protocols in Molecular Biology. , Chapter 4 1-19 (2013).
Ingolia, N. T., Ghaemmaghami, S., Newman, J. R., Weissman, J. S. Genome-wide analysis in vivo of translation with nucleotide resolution using ribosome profiling. Science. 324 (5924), 218-223 (2009).
Xiao, Z., et al. De novo annotation and characterization of the translatome with ribosome profiling data. Nucleic Acids Research. 46 (10), 61(2018).
Lin, Y., et al. eIF3 Associates with 80S Ribosomes to Promote Translation Elongation, Mitochondrial Homeostasis, and Muscle Health. Molecular Cell. 79 (4), 575-587 (2020).
Dainat, J. AGAT: Another Gff Analysis Toolkit to handle annotations in any GTF/GFF format. , Available from: https://agat.readthedocs.io/en/latest/gff_to_gtf.html (2020).
Edgar, R. Gene Expression Omnibus. , Available from: https://www.ncbi.nim.nih.gov/geo (2002).
Langmead, B. Bowtie: an ultrafast memory-efficient short read aligner. , Available from: http://bowtie-bio.sourceforge.net/manual.shtml (2021).
Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. The ribosome profiling strategy for monitoring translation in vivo by deep sequencing of ribosome-protected mRNA fragments. Nature Protocols. 7 (8), 1534-1550 (2012).
Dobin, A. STAR manual. , Available from: https://github.com/alexdobin/STAR/blob/master/doc/STARmanual.pdf (2022).
Elzanowski, A. The genetic codes. , Available from: https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi (2019).
Li, F. RiboMiner. , Available from: https://github.com/xryanglab/RiboMiner (2020).
Ingolia, N. T., Hussmann, J. A., Weissman, J. S. Ribosome profiling: global views of translation. Cold Spring Harbor Perspectives in Biology. 11 (5), 032698(2018).
Lee, S., et al. Global mapping of translation initiation sites in mammalian cells at single-nucleotide resolution. Proceedings of the National Academy of Sciences of the United States of America. 109 (37), 2424-2432 (2012).
Gao, X., et al. Quantitative profiling of initiating ribosomes in vivo. Nature Methods. 12 (2), 147-153 (2015).
Spealman, P., Naik, A., McManus, J. uORF-seqr: A Machine Learning-Based approach to the identification of upstream open reading frames in yeast. Methods in Molecular Biol. 2252, 313-329 (2021).
Xiao, Z. RiboCode. , Available from: https://github.com/xryanglab/RiboCode (2018).
Sharma, P., Wu, J., Nilges, B. S., Leidel, S. A. Humans and other commonly used model organisms are resistant to cycloheximide-mediated biases in ribosome profiling experiments. Nature Communications. 12 (1), 5094(2021).

Access restricted. Please log in or start a trial to view this content.

Перепечатки и разрешения

Запросить разрешение на использование текста или рисунков этого JoVE статьи

Запросить разрешение

Смотреть дополнительные статьи

180 uORF dORF

This article has been published

Video Coming Soon

Keep me updated:

Конфиденциальность

Условия эксплуатации

Политика

СВЯЖИТЕСЬ С НАМИ

РЕКОМЕНДОВАТЬ БИБЛИОТЕКЕ

НОВОСТИ JoVE

Исследования

Образование

АВТОРЫ

Библиотекарь

О JoVE