In This Article

Summary

Translacja rybosomów dekoduje trzy nukleotydy na kodon na peptydy. Ich ruch wzdłuż mRNA, wychwycony przez profilowanie rybosomów, wytwarza ślady wykazujące charakterystyczną okresowość trypletową. Protokół ten opisuje, w jaki sposób używać RiboCode do rozszyfrowania tej wyróżniającej się cechy na podstawie danych profilowania rybosomów w celu identyfikacji aktywnie translowanych otwartych ramek odczytu na poziomie całego transkryptomu.

Abstract

Identyfikacja otwartych ramek odczytu (ORF), szczególnie tych kodujących małe peptydy i aktywnie tłumaczonych w określonych kontekstach fizjologicznych, jest kluczowa dla kompleksowych adnotacji translatomów zależnych od kontekstu. Profilowanie rybosomów, technika wykrywania miejsc wiązania i gęstości translacji rybosomów na RNA, oferuje drogę do szybkiego odkrycia, gdzie zachodzi translacja w skali całego genomu. Nie jest to jednak trywialne zadanie w bioinformatyce, aby skutecznie i kompleksowo zidentyfikować translujące ORF do profilowania rybosomów. Opisano tutaj łatwy w użyciu pakiet o nazwie RiboCode, przeznaczony do wyszukiwania aktywnie translujących ORF-y dowolnej wielkości ze zniekształconych i niejednoznacznych sygnałów w danych profilowania rybosomów. Biorąc za przykład nasz poprzednio opublikowany zestaw danych, ten artykuł zawiera instrukcje krok po kroku dla całego potoku RiboCode, od wstępnego przetwarzania nieprzetworzonych danych po interpretację końcowych plików wyników wyjściowych. Ponadto, w celu oceny szybkości translacji adnotowanych ORF, szczegółowo opisano również procedury wizualizacji i kwantyfikacji gęstości rybosomów na każdym ORF. Podsumowując, niniejszy artykuł jest przydatną i aktualną instrukcją dla dziedzin badawczych związanych z translacją, małymi ORF i peptydami.

Introduction

Ostatnio, rosnąca liczba badań ujawniła powszechną produkcję peptydów translowanych z ORF genów kodujących i wcześniej opisanych genów jako niekodujących, takich jak długie niekodujące RNA (lncRNAs)1,2,3,4,5,6,7,8. Te translowane ORF są regulowane lub indukowane przez komórki, aby reagować na zmiany środowiskowe, stres i różnicowanie komórek1,8,9,10,11,12,13. Wykazano, że produkty translacji niektórych ORF odgrywają ważną rolę regulacyjną w różnych procesach biologicznych w rozwoju i fizjologii. Na przykład Chng i wsp.14 odkryli hormon peptydowy o nazwie Elabela (Ela, znany również jako Apela/Ende/Toddler), który ma kluczowe znaczenie dla rozwoju układu sercowo-naczyniowego. Pauli i in. zasugerowali, że Ela działa również jako mitogen, który promuje migrację komórek we wczesnym stadium ryb embryo15. Magny i wsp. opisali dwa mikropeptydy zawierające mniej niż 30 aminokwasów regulujące transport wapnia i wpływające na regularne skurcze mięśni u Drosophila heart10.

Nie jest jasne, ile takich peptydów jest kodowanych przez genom i czy są one biologicznie istotne. Dlatego systematyczna identyfikacja tych potencjalnie kodujących ORF-ów jest wysoce pożądana. Jednak bezpośrednie określanie produktów tych ORF (tj. białka lub peptydu) przy użyciu tradycyjnych podejść, takich jak ochrona ewolucyjna16,17 i spektrometria mas18,19 jest trudne, ponieważ skuteczność wykrywania obu podejść zależy od długości, obfitości i składu aminokwasowego wytwarzanych białek lub peptydów. Pojawienie się profilowania rybosomów, techniki identyfikacji zajętości rybosomów na mRNA w rozdzielczości nukleotydów, zapewniło precyzyjny sposób oceny potencjału kodowania różnych transkryptów3,20,21, niezależnie od ich długości i składu. Ważną i często wykorzystywaną cechą do identyfikacji aktywnie translujących ORF za pomocą profilowania rybosomów jest okresowość trzech nukleotydów (3-nt) śladów rybosomu na mRNA od kodonu start do kodonu stop. Jednak dane z profilowania rybosomów często mają kilka problemów, w tym niskie i rzadkie odczyty sekwencjonowania wzdłuż ORF, wysoki szum sekwencjonowania i zanieczyszczenia rybosomalnym RNA (rRNA). W związku z tym zniekształcone i niejednoznaczne sygnały generowane przez takie dane osłabiają wzorce okresowości 3-nt śladów rybosomów na mRNA, co ostatecznie utrudnia identyfikację ORF o wysokim poziomie pewności.

Pakiet o nazwie "RiboCode" zaadaptował zmodyfikowany test rang ze znakiem Wilcoxona i strategię integracji wartości P, aby sprawdzić, czy ORF ma znacznie więcej fragmentów chronionych rybosomem w ramce (RPF) niż RPFy poza ramką22. Wykazano, że jest bardzo wydajny, czuły i dokładny w adnotacji de novo translatomu w symulowanych i rzeczywistych danych profilowania rybosomów. W tym miejscu opisujemy, jak używać tego narzędzia do wykrywania potencjalnych translacji ORF z surowych zestawów danych sekwencjonowania profilowania rybosomów wygenerowanych przez poprzednie badanie23. Te zestawy danych wykorzystano do zbadania funkcji podjednostki EIF3 "E" (EIF3E) w translacji poprzez porównanie profili zajmowania rybosomów komórek MCF-10A transfekowanych małymi interferującymi RNA (si-Ctrl) i EIF3E (si-eIF3e). Stosując RiboCode do tych przykładowych zestawów danych, wykryliśmy 5 633 nowe ORF-y potencjalnie kodujące małe peptydy lub białka. Te ORF zostały podzielone na różne typy w oparciu o ich lokalizację względem regionów kodujących, w tym ORF (uORF), ORF (dORF), nakładające się ORF, ORF z nowych genów kodujących białka (nowe PCG) i ORF-y z nowych genów niekodujących białek (nowe NonPCGs). Gęstości odczytu RPF na uORF były znacznie zwiększone w komórkach z niedoborem EIF3E w porównaniu z komórkami kontrolnymi, co może być przynajmniej częściowo spowodowane wzbogaceniem aktywnie translujących rybosomów. Zlokalizowana akumulacja rybosomu w regionie od 25. do 75. kodonu komórek z niedoborem EIF3E wskazywała na blokadę wydłużenia translacji we wczesnym stadium. Protokół ten pokazuje również, jak wizualizować gęstość RPF w pożądanym regionie w celu zbadania wzorców okresowości 3-nt śladów rybosomów na zidentyfikowanych ORF. Analizy te pokazują potężną rolę RiboCode w identyfikacji tłumaczących ORF i badaniu regulacji tłumaczenia.

Access restricted. Please log in or start a trial to view this content.

Protocol

1. Konfiguracja środowiska i instalacja RiboCode

  1. Otwórz okno terminala Linux i utwórz środowisko conda:
    conda create -n RiboCode python=3.8
  2. Przełącz się na utworzone środowisko i zainstaluj RiboCode oraz zależności:
    conda aktywuj RiboCode
    conda install -c bioconda ribocode ribominer-tools fastx_toolkit cutadapt muszka gwiazda samtools

2. Przygotowanie danych

  1. Pobierz pliki referencyjne genomu.
    1. Aby zapoznać się z sekwencją referencyjną, przejdź do strony Ensemble pod adresem https://www.ensembl.org/index.html, kliknij górne menu Pobierz i menu po lewej stronie FTP Download. W wyświetlonej tabeli kliknij pozycję FASTA w kolumnie DNA (FASTA) i wierszu, w którym Gatunek to Człowiek. Na otwartej stronie skopiuj link do Homo_sapiens. GRCh38.dna.primary_assembly.fa.gz, a następnie pobierz i rozpakuj go w terminalu:
      wget -c \
      http://ftp.ensembl.org/pub/release-104/fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz
      gzip -d Homo_sapiens. GRCh38.dna.primary_assembly.fa.gz
    2. Aby dodać adnotację do odwołania, kliknij prawym przyciskiem myszy GTF w kolumnie Zestawy genów na ostatnio otwartej stronie internetowej. Skopiuj link do Homo_sapiens. GRCh38.104.gtf.gz i pobierz go za pomocą:
      wget -c \
      http://ftp.ensembl.org/pub/release-104/gtf/homo_sapiens/Homo_sapiens.GRCh38.104.gtf.gz
      gzip -d Homo_sapiens. GRCh38.104.gtf.gz

      UWAGA: Zaleca się pobranie pliku GTF ze strony internetowej Ensemble, ponieważ zawiera on adnotacje genomu zorganizowane w trzypoziomową hierarchię, tj. każdy gen zawiera transkrypty zawierające eksony i opcjonalne translacje (np. sekwencje kodujące [CDS], miejsce rozpoczęcia translacji, miejsce zakończenia translacji). Jeśli brakuje adnotacji genu lub transkryptu, na przykład pliku GTF uzyskanego z UCSC lub NCBI, użyj GTFupdate, aby wygenerować zaktualizowany GTF z pełnymi adnotacjami hierarchii rodzic-dziecko: GTFupdate original.gtf > updated.gtf. W przypadku pliku adnotacji w formacie .gff użyj AGAT toolkit24 lub dowolnego innego narzędzia, aby przekonwertować do formatu .gtf.
  2. Uzyskaj sekwencje rRNA.
    1. Otwórz przeglądarkę UCSC Genome Browser pod https://genome.ucsc.edu i kliknij Narzędzia | Przeglądarka tabel na liście rozwijanej.
    2. Na otwartej stronie określ Ssak dla kladu, Człowiek dla genomu, Wszystkie tabele dla grupy, rmask dla tabeli i genom dla regionu. W przypadku filtru kliknij przycisk Utwórz, aby przejść do nowej strony i ustawić repClass jako pasujące do rRNA.
    3. Kliknij przycisk Prześlij, a następnie ustaw format wyjściowy na sekwencję i nazwę pliku wyjściowego jako hg38_rRNA.fa. Na koniec kliknij Pobierz dane wyjściowe | Pobierz sekwencję, aby pobrać sekwencję rRNA.
  3. Pobierz zestawy danych profilowania rybosomów z archiwum odczytu sekwencji ().
    1. Pobierz powtórzone próbki grupy badanej si-eIF3e i zmień ich nazwę:
      fastq-dump SRR9047190 SRR9047191 SRR9047192
      mv SRR9047190.fastq si-eIF3e-1.fastq
      mv SRR9047191.fastq si-eIF3e-2.fastq
      mv SRR9047192.fastq si-eIF3e-3.fastq
    2. Pobierz replikowane próbki grupy kontrolnej i zmień ich nazwę:
      fastq-dump SRR9047193 SRR9047194 SRR9047195
      mv SRR9047193.fastq si-Ctrl-1.fastq
      mv SRR9047194.fastq si-Ctrl-2.fastq
      mv SRR9047195.fastq si-Ctrl-3.fastq
      UWAGA: Identyfikatory przystąpienia do dla tych przykładowych zestawów danych zostały uzyskane ze strony internetowej Gene Expression Omnibus (GEO) 25 przez wyszukanie GSE131074.

3. Przytnij adaptery i usuń zanieczyszczenie rRNA

  1. (Opcjonalnie) Usuń adaptery z danych sekwencjonowania. Pomiń ten krok, jeśli sekwencje adaptera zostały już przycięte, tak jak w tym przypadku. W przeciwnym razie użyj cutadapt, aby przyciąć adaptery z reads.
    dla i w si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
    do
    cutadapt -m 15 --match-read-wildcards -a CTGTAGGCACCATCAAT \
    -o ${i}_trimmed.fastq ${i}.fastq
    Zrobione
    UWAGA: Sekwencja adaptera po parametrze -a będzie się różnić w zależności od przygotowania biblioteki cDNA. Odczyty krótsze niż 15 (podane przez -m) są odrzucane, ponieważ fragmenty chronione przez rybosomy są zwykle dłuższe niż ten rozmiar.
  2. Usuń zanieczyszczenie rRNA, wykonując następujące czynności:
    1. Sekwencje referencyjne indeksu rRNA:
      muszka-zbuduj -f hg38_rRNA.fa hg38_rRNA
    2. Dopasuj odczyty do odniesienia rRNA, aby wykluczyć odczyty pochodzące z rRNA:
      dla i w si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
      do
      muszka -n 0 -y -a --norc --best --strata -S -p 4 -l 15 \
      --un=./${i}_noncontam.fastq hg38_rRNA -q ${i}.fastq ${i}.aln
      Zrobione
      -p określa liczbę wątków do równoległego uruchamiania zadań. Biorąc pod uwagę stosunkowo mały rozmiar odczytów RPF, inne argumenty (np. -n, -y, -a, -norc, --best, --strata i -l) powinny być określone, aby zagwarantować, że raportowane wyrównania są najlepsze. Aby uzyskać więcej informacji, odwiedź stronę internetową Bowtie26.

4. Dopasuj czyste odczyty do genomu

  1. Utwórz indeks genomu.
    mkdir STAR_hg38_genome
    STAR --runThreadN 8 --runMode genomeGenerate --genomeDir ./STAR_hg38_genome --genomeFastaFiles Homo_sapiens. GRCh38.dna.primary_assembly.fa --sjdbGTFplik Homo_sapiens. GRCh38.104.gtf
  2. Dopasuj czyste odczyty (bez zanieczyszczenia rRNA) do utworzonego odniesienia.
    dla i w si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
    do
    STAR --runThreadN 8 --outFilterType Normal --outWigType wiggle --outWigType Stranded --outWigNorm RPM --outFilterMismatchNmax 1 --outFilterMultimapNmax 1 --genomeDir STAR_hg38_genome --readFilesIn ${i}_noncontam.fastq --outFileNamePrefix ${i}. --outSAMTYPE BAM SortedByCoordinate --quantMode TranscriptomeSAM GeneCounts --outSAMattributes All
    Zrobione
    UWAGA: Nieszablonowy nukleotyd jest często dodawany do końca 5' każdego odczytu przez odwrotną transkryptazę27, który zostanie skutecznie odcięty przez STAR, ponieważ domyślnie wykonuje miękkie przycinanie. Parametry dla STAR są opisane w STAR manual28.
  3. Sortowanie i indeksowanie plików wyrównania.
    dla i w si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
    do
    samtools sort -T ${i}. Aligned.toTranscriptome.out.sorted \
    -o ${i}. Aligned.toTranscriptome.out.sorted.bam \
    ${i}. Aligned.toTranscriptome.out.bam
    samtools index ${i}. Aligned.toTranscriptome.out.sorted.bam
    samtools index ${i}. Aligned.sortedByCoord.out.bam
    gotowy

5. Wybór rozmiaru RPFów i identyfikacja ich miejsc P

  1. Przygotuj adnotacje do transkrypcji.
    prepare_transcripts -g Homo_sapiens. GRCh38.104.gtf \
    -f Homo_sapiens. GRCh38.dna.primary_assembly.fa -o RiboCode_annot
    UWAGA: To polecenie zbiera wymagane informacje o transkryptach mRNA z pliku GTF i wyodrębnia sekwencje dla wszystkich transkryptów mRNA z pliku FASTA (każdy transkrypt jest składany przez połączenie eksonów zgodnie ze strukturami zdefiniowanymi w pliku GTF).
  2. Wybierz RPF o określonych długościach i określ ich pozycje P-site.
    dla i w si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
    do
    metaplots -a RiboCode_annot -r ${i}. Aligned.toTranscriptome.out.bam \
    -o ${i} -f0_percent 0.35 -pv1 0.001 -pv2 0.001
    Zrobione
    UWAGA: To polecenie wykreśla zagregowane profile końca 5' wyrównanych odczytów każdej długości wokół kodonów rozpoczęcia (lub zakończenia) translacji z adnotacjami. Miejsce P zależne od długości odczytu można wyznaczyć ręcznie, badając wykresy rozkładu (np. Rysunek 1B) odległości przesunięcia między końcami 5' głównych odczytów a kodonem startowym. RiboCode generuje również plik konfiguracyjny dla każdej próbki, w którym automatycznie określane są pozycje P-site odczytów wyświetlających znaczące wzorce okresowości 3-nt. Parametry -f0_percent, -pv1 i -pv2 definiują próg proporcji i wartości odcięcia wartości p dla wyboru odczytów RPF wzbogaconych w ramce odczytu. W tym przykładzie nukleotydy +12, +13 i +13 z końca 5' odczytów 29, 30 i 31 nt są ręcznie definiowane w każdym pliku konfiguracyjnym.
  3. Edytuj pliki konfiguracyjne dla każdej próbki i scal je
    UWAGA: Aby wygenerować konsensusowy zestaw unikalnych ORF i zapewnić wystarczające pokrycie odczytów do przeprowadzenia późniejszej analizy, wybrane odczyty wszystkich próbek w poprzednim kroku są łączone. Odczyty o określonych długościach zdefiniowanych w pliku merged_config.txt (Plik uzupełniający 1) i informacje o ich lokalizacji P są wykorzystywane do oceny potencjału translacyjnego ORF w następnym kroku.

6. Adnotacja de novo tłumacząca ORFy

  1. Uruchom polecenie RiboCode.
    RiboCode -a RiboCode_annot -c merged_config.txt -l yes -g \
    -o RiboCode_ORFs_result -s ATG -m 5 -A CTG,GTG,TTG

    Gdzie ważne parametry tego polecenia są następujące:
    -c, plik konfiguracyjny zawierający ścieżkę do plików wejściowych oraz informacje o wybranych odczytach i ich P-sites.
    -l, dla transkryptów mających wiele kodonów start przed kodonami stop, czy najdłuższe ORF (region od najbardziej dystalnego kodonu start do kodonu stop) są używane do oceny ich potencjału translacyjnego. W przypadku ustawienia wartości no, kodony początkowe zostaną automatycznie określone.
    -s, kanoniczny kodon (kodony) start używany do identyfikacji ORFów.
    -A, (opcjonalnie) niekanoniczne kodony start (np. CTG, GTG i TTG dla człowieka) używane do identyfikacji ORF, które mogą różnić się mitochondriami lub jądrami innych gatunków29.
    -m, minimalna długość (tj. aminokwasów) ORFs.
    -o, prefiks nazwy pliku wyjściowego zawierającego szczegóły przewidywanych ORF-ów (Plik uzupełniający 2).
    -g i -b, wyprowadza przewidywane ORF-y odpowiednio do formatu gtf lub bed.

7. (Opcjonalnie) Kwantyfikacja i statystyki ORF

  1. Zliczanie odczytów RPF w każdym ORF.
    dla i w si-Ctrl-1 si-Ctrl-2 si-Ctrl-3 si-eIF3e-1 si-eIF3e-2 si-eIF3e-3
    do
    ORFcount -g RiboCode_ORFs_result_collapsed.gtf \
    -r ${i}. Aligned.sortedByCoord.out.bam -f 15 -l 5 -m 25 -M 35 \
    -o ${i}_ORF.counts -s tak -c przecięcie-ścisłe<br /> Zrobione
    UWAGA: Aby wykluczyć potencjalne akumulację rybosomów wokół początku i końca ORF, liczba odczytów przydzielonych w pierwszych 15 (określonych przez -f) i ostatnich 5 kodonach (specyficznych dla -l) nie jest zliczana. Opcjonalnie długości zliczanych RPF są ograniczone do zakresu od 25 do 35 nt (typowe rozmiary RPF).
  2. Oblicz podstawowe statystyki wykrytych ORF za pomocą RiboCode:
    Rscript RiboCode_utils. R
    UWAGA: RiboCode_utils. R (Plik uzupełniający 3) zawiera szereg statystyk dla danych wyjściowych RiboCode, np. zliczanie liczby zidentyfikowanych ORF, wyświetlanie rozkładu długości ORF i obliczanie znormalizowanych gęstości RPF (tj. RPKM, odczyty na kilobazę na milion zmapowanych odczytów).

8. (Opcjonalnie) Wizualizacja przewidywanych ORFów

  1. Uzyskaj względne pozycje kodonów start i stop dla pożądanego ORF (np. ENSG00000100902_35292349_35292552_67) na jego transkrypcji z RiboCode_ORFs_result_collapsed.txt (Plik uzupełniający 3). Następnie wykreśl gęstość odczytów RPF w ORF:
    plot_orf_density -a RiboCode_annot -c merged_config.txt -t ENST00000622405 \
    -s 33 -e 236 --start-codon ATG -o ENSG00000100902_35292349_35292552_67
    Gdzie -s i -e określa pozycję początkową i końcową tłumaczenia wykreślanego ORF. --start-codon definiuje kodon start ORF, który pojawi się w tytule rysunku. -o definiuje prefiks nazwy pliku wyjściowego.

9. (Opcjonalnie) Analiza metagenów za pomocą RiboMiner

UWAGA: Przeprowadź analizę metagenu, aby ocenić wpływ knockdownu EIF3E na translację zidentyfikowanych adnotowanych ORF, wykonując poniższe czynności:

  1. Generuj adnotacje do transkryptów dla RiboMiner, który wyodrębnia najdłuższy transkrypt dla każdego genu na podstawie pliku adnotacji wygenerowanego przez RiboCode (krok 5.1).
    OutputTranscriptInfo -c RiboCode_annot/transcripts_cds.txt \
    -g Homo_sapiens. GRCh38.104.gtf -f RiboCode_annot/transcripts_sequence.fa \
    -o longest.transcripts.info.txt -O all.transcripts.info.txt
  2. Przygotuj plik konfiguracyjny dla RiboMiner. Skopiuj plik konfiguracyjny wygenerowany przez polecenie metaplots programu RiboCode (krok 5.4) i zmień jego nazwę na "RiboMiner_config.txt". Następnie zmodyfikuj go zgodnie z formatem pokazanym w pliku uzupełniającym 4.
  3. Analizy metagenów z wykorzystaniem RiboMiner
    1. Użyj MetageneAnalysis, aby wygenerować zagregowany i uśredniony profil gęstości RPF w transkryptach.
      MetageneAnalysis -f RiboMiner_config.txt -c longest.transcripts.info.txt \
      -o MA_normed -U kodon -M RPKM -u 100 -d 400 -l 100 -n 10 -m 1 -e 5 --norm tak \
      -y 100 --type UTR
      Gdzie ważne parametry to: --type, analizując regiony CDS lub UTR; --norm, czy znormalizował gęstość odczytu; -y, liczba kodonów użytych dla każdego transkryptu; -U, wykreślić gęstość RPF na poziomie kodonu lub na poziomie nt; -u i -d, definiują zakres analizowanych regionów względem kodonu start lub kodonu stop; -l, minimalna długość (tj. liczba kodonów) CDS; -M, tryb filtrowania transkrypcji, albo zliczenia, albo RPKM; -n minimalne liczby lub RPKM w CDS do analizy. -m minimalna liczba lub RPKM CDS w znormalizowanym regionie; -e, liczba kodonów wykluczonych z obszaru znormalizowanego.
    2. Wygeneruj zestaw plików pdf do porównania zajętości rybosomów na mRNA w komórkach kontrolnych i komórkach z niedoborem eIF3.
      PlotMetageneAnalysis -i MA_normed_dataframe.txt -o MA_normed \
      -g si-Ctrl,si-eIF3e -r si-Ctrl-1,si-Ctrl-2,si-Ctrl-3__si-eIF3e-1,si-eIF3e-2,si-eIF3e-3 -u 100 -d 400 --mode mean
      UWAGA: PlotMetageneAnalysis generuje zestaw plików pdf. Szczegółowe informacje na temat korzystania z MetageneAnalysis i PlotMetageneAnalysis są dostępne na stronie internetowej RiboMiner30.

Access restricted. Please log in or start a trial to view this content.

Results

Przykładowe zestawy danych profilowania rybosomów zostały zdeponowane w bazie danych GEO pod numerem dostępu GSE131074. Wszystkie pliki i kody używane w tym protokole są dostępne w plikach uzupełniających 1-4. Stosując RiboCode do zestawu opublikowanych zestawów danych profilowania rybosomów23, zidentyfikowaliśmy nowe ORF aktywnie ulegające translacji w komórkach MCF-10A traktowanych siRNA kontrolnym i EIF3E. Aby wybrać od...

Access restricted. Please log in or start a trial to view this content.

Discussion

Profilowanie rybosomów daje bezprecedensową możliwość badania działania rybosomów w komórkach w skali genomu. Precyzyjne rozszyfrowanie informacji przenoszonych przez dane z profilowania rybosomów może dostarczyć informacji na temat tego, które regiony genów lub transkryptów aktywnie się tłumaczą. Ten protokół krok po kroku zawiera wskazówki dotyczące używania RiboCode do szczegółowej analizy danych profilowania rybosomów, w tym instalacji pakietów, przygotowania danych, wykonywania poleceń, wy...

Access restricted. Please log in or start a trial to view this content.

Disclosures

Autorzy nie mają do ujawnienia żadnych konfliktów interesów.

Acknowledgements

Autorzy pragną podziękować za wsparcie ze strony zasobów obliczeniowych dostarczanych przez platformę HPCC Uniwersytetu Xi'an Jiaotong. Z.X. dziękuje za Plan Wsparcia Młodych Talentów Uniwersytetu Xi'an Jiaotong.

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
Komputer/serwer z systemem LinuxAny--
Anaconda lub MinicondaAnaconda-Anaconda: https://www.anaconda.com; Miniconda:https://docs.conda.io/en/latest/miniconda.html
RRFoundation-https://www.r-project.org/
RstudioRstudio-https://www.rstudio.com/

References

  1. Eisenberg, A. R., et al. Translation Initiation Site Profiling Reveals Widespread Synthesis of Non-AUG-Initiated Protein Isoforms in Yeast. Cell Systems. 11 (2), 145-160 (2020).
  2. Spealman, P., et al. Conserved non-AUG uORFs revealed by a novel regression analysis of ribosome profiling data. Genome Research. 28 (2), 214-222 (2018).
  3. Ingolia, N. T., Lareau, L. F., Weissman, J. S. Ribosome profiling of mouse embryonic stem cells reveals the complexity and dynamics of mammalian proteomes. Cell. 147 (4), 789-802 (2011).
  4. Bazzini, A. A., et al. Identification of small ORFs in vertebrates using ribosome footprinting and evolutionary conservation. The EMBO Journal. 33 (9), 981-993 (2014).
  5. Ingolia, N. T., et al. Ribosome profiling reveals pervasive translation outside of annotated protein-coding genes. Cell Reports. 8 (5), 1365-1379 (2014).
  6. Chew, G. L., Pauli, A., Schier, A. F. Conservation of uORF repressiveness and sequence features in mouse, human and zebrafish. Nature Communications. 7, 11663(2016).
  7. Zhang, H., et al. Determinants of genome-wide distribution and evolution of uORFs in eukaryotes. Nature Communications. 12 (1), 1076(2021).
  8. Guenther, U. P., et al. The helicase Ded1p controls use of near-cognate translation initiation codons in 5' UTRs. Nature. 559 (7712), 130-134 (2018).
  9. Goldsmith, J., et al. Ribosome profiling reveals a functional role for autophagy in mRNA translational control. Communications Biology. 3 (1), 388(2020).
  10. Magny, E. G., et al. Conserved regulation of cardiac calcium uptake by peptides encoded in small open reading frames. Science. 341 (6150), 1116-1120 (2013).
  11. Stumpf, C. R., Moreno, M. V., Olshen, A. B., Taylor, B. S., Ruggero, D. The translational landscape of the mammalian cell cycle. Molecular Cell. 52 (4), 574-582 (2013).
  12. Gerashchenko, M. V., Lobanov, A. V., Gladyshev, V. N. Genome-wide ribosome profiling reveals complex translational regulation in response to oxidative stress. Proceedings of the National Academy of Sciences of the United States of America. 109 (43), 17394-17399 (2012).
  13. Andreev, D. E., et al. Oxygen and glucose deprivation induces widespread alterations in mRNA translation within 20 minutes. Genome Biology. 16, 90(2015).
  14. Chng, S. C., Ho, L., Tian, J., Reversade, B. ELABELA: a hormone essential for heart development signals via the apelin receptor. Developmental Cell. 27 (6), 672-680 (2013).
  15. Pauli, A., et al. Toddler: an embryonic signal that promotes cell movement via Apelin receptors. Science. 343 (6172), 1248636(2014).
  16. Stark, A., et al. Discovery of functional elements in 12 Drosophila genomes using evolutionary signatures. Nature. 450 (7167), 219-232 (2007).
  17. Lin, M. F., Jungreis, I., Kellis, M. PhyloCSF: a comparative genomics method to distinguish protein coding and non-coding regions. Bioinformatics. 27 (13), 275-282 (2011).
  18. Slavoff, S. A., et al. Peptidomic discovery of short open reading frame-encoded peptides in human cells. Nature Chemical Biology. 9 (1), 59-64 (2013).
  19. Schwaid, A. G., et al. Chemoproteomic discovery of cysteine-containing human short open reading frames. Journal of the American Chemical Society. 135 (45), 16750-16753 (2013).
  20. Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. Genome-wide annotation and quantitation of translation by ribosome profiling. Current Protocols in Molecular Biology. , Chapter 4 1-19 (2013).
  21. Ingolia, N. T., Ghaemmaghami, S., Newman, J. R., Weissman, J. S. Genome-wide analysis in vivo of translation with nucleotide resolution using ribosome profiling. Science. 324 (5924), 218-223 (2009).
  22. Xiao, Z., et al. De novo annotation and characterization of the translatome with ribosome profiling data. Nucleic Acids Research. 46 (10), 61(2018).
  23. Lin, Y., et al. eIF3 Associates with 80S Ribosomes to Promote Translation Elongation, Mitochondrial Homeostasis, and Muscle Health. Molecular Cell. 79 (4), 575-587 (2020).
  24. Dainat, J. AGAT: Another Gff Analysis Toolkit to handle annotations in any GTF/GFF format. , Available from: https://agat.readthedocs.io/en/latest/gff_to_gtf.html (2020).
  25. Edgar, R. Gene Expression Omnibus. , Available from: https://www.ncbi.nim.nih.gov/geo (2002).
  26. Langmead, B. Bowtie: an ultrafast memory-efficient short read aligner. , Available from: http://bowtie-bio.sourceforge.net/manual.shtml (2021).
  27. Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M., Weissman, J. S. The ribosome profiling strategy for monitoring translation in vivo by deep sequencing of ribosome-protected mRNA fragments. Nature Protocols. 7 (8), 1534-1550 (2012).
  28. Dobin, A. STAR manual. , Available from: https://github.com/alexdobin/STAR/blob/master/doc/STARmanual.pdf (2022).
  29. Elzanowski, A. The genetic codes. , Available from: https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi (2019).
  30. Li, F. RiboMiner. , Available from: https://github.com/xryanglab/RiboMiner (2020).
  31. Ingolia, N. T., Hussmann, J. A., Weissman, J. S. Ribosome profiling: global views of translation. Cold Spring Harbor Perspectives in Biology. 11 (5), 032698(2018).
  32. Lee, S., et al. Global mapping of translation initiation sites in mammalian cells at single-nucleotide resolution. Proceedings of the National Academy of Sciences of the United States of America. 109 (37), 2424-2432 (2012).
  33. Gao, X., et al. Quantitative profiling of initiating ribosomes in vivo. Nature Methods. 12 (2), 147-153 (2015).
  34. Spealman, P., Naik, A., McManus, J. uORF-seqr: A Machine Learning-Based approach to the identification of upstream open reading frames in yeast. Methods in Molecular Biol. 2252, 313-329 (2021).
  35. Xiao, Z. RiboCode. , Available from: https://github.com/xryanglab/RiboCode (2018).
  36. Sharma, P., Wu, J., Nilges, B. S., Leidel, S. A. Humans and other commonly used model organisms are resistant to cycloheximide-mediated biases in ribosome profiling experiments. Nature Communications. 12 (1), 5094(2021).

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Explore More Articles

Profilowanie rybosom wtranslacja mRNARiboCoderegulacja translacyjnaregiony genomunowe peptydyprocedura obliczeniowarodowisko Condastrona internetowa Ensemblpobieranie FAPSAgenom ludzkisekwencje RRNAprzegl darka genomu UCSCarchiwum odczytu sekwencjipr bki grupy kontrolnejzanieczyszczenie RRNA