Method Article
* These authors contributed equally
Translacja rybosomów dekoduje trzy nukleotydy na kodon na peptydy. Ich ruch wzdłuż mRNA, wychwycony przez profilowanie rybosomów, wytwarza ślady wykazujące charakterystyczną okresowość trypletową. Protokół ten opisuje, w jaki sposób używać RiboCode do rozszyfrowania tej wyróżniającej się cechy na podstawie danych profilowania rybosomów w celu identyfikacji aktywnie translowanych otwartych ramek odczytu na poziomie całego transkryptomu.
Identyfikacja otwartych ramek odczytu (ORF), szczególnie tych kodujących małe peptydy i aktywnie tłumaczonych w określonych kontekstach fizjologicznych, jest kluczowa dla kompleksowych adnotacji translatomów zależnych od kontekstu. Profilowanie rybosomów, technika wykrywania miejsc wiązania i gęstości translacji rybosomów na RNA, oferuje drogę do szybkiego odkrycia, gdzie zachodzi translacja w skali całego genomu. Nie jest to jednak trywialne zadanie w bioinformatyce, aby skutecznie i kompleksowo zidentyfikować translujące ORF do profilowania rybosomów. Opisano tutaj łatwy w użyciu pakiet o nazwie RiboCode, przeznaczony do wyszukiwania aktywnie translujących ORF-y dowolnej wielkości ze zniekształconych i niejednoznacznych sygnałów w danych profilowania rybosomów. Biorąc za przykład nasz poprzednio opublikowany zestaw danych, ten artykuł zawiera instrukcje krok po kroku dla całego potoku RiboCode, od wstępnego przetwarzania nieprzetworzonych danych po interpretację końcowych plików wyników wyjściowych. Ponadto, w celu oceny szybkości translacji adnotowanych ORF, szczegółowo opisano również procedury wizualizacji i kwantyfikacji gęstości rybosomów na każdym ORF. Podsumowując, niniejszy artykuł jest przydatną i aktualną instrukcją dla dziedzin badawczych związanych z translacją, małymi ORF i peptydami.
Ostatnio, rosnąca liczba badań ujawniła powszechną produkcję peptydów translowanych z ORF genów kodujących i wcześniej opisanych genów jako niekodujących, takich jak długie niekodujące RNA (lncRNAs)1,2,3,4,5,6,7,8. Te translowane ORF są regulowane lub indukowane przez komórki, aby reagować na zmiany środowiskowe, stres i różnicowanie komórek1,8,9,10,11,12,13. Wykazano, że produkty translacji niektórych ORF odgrywają ważną rolę regulacyjną w różnych procesach biologicznych w rozwoju i fizjologii. Na przykład Chng i wsp.14 odkryli hormon peptydowy o nazwie Elabela (Ela, znany również jako Apela/Ende/Toddler), który ma kluczowe znaczenie dla rozwoju układu sercowo-naczyniowego. Pauli i in. zasugerowali, że Ela działa również jako mitogen, który promuje migrację komórek we wczesnym stadium ryb embryo15. Magny i wsp. opisali dwa mikropeptydy zawierające mniej niż 30 aminokwasów regulujące transport wapnia i wpływające na regularne skurcze mięśni u Drosophila heart10.
Nie jest jasne, ile takich peptydów jest kodowanych przez genom i czy są one biologicznie istotne. Dlatego systematyczna identyfikacja tych potencjalnie kodujących ORF-ów jest wysoce pożądana. Jednak bezpośrednie określanie produktów tych ORF (tj. białka lub peptydu) przy użyciu tradycyjnych podejść, takich jak ochrona ewolucyjna16,17 i spektrometria mas18,19 jest trudne, ponieważ skuteczność wykrywania obu podejść zależy od długości, obfitości i składu aminokwasowego wytwarzanych białek lub peptydów. Pojawienie się profilowania rybosomów, techniki identyfikacji zajętości rybosomów na mRNA w rozdzielczości nukleotydów, zapewniło precyzyjny sposób oceny potencjału kodowania różnych transkryptów3,20,21, niezależnie od ich długości i składu. Ważną i często wykorzystywaną cechą do identyfikacji aktywnie translujących ORF za pomocą profilowania rybosomów jest okresowość trzech nukleotydów (3-nt) śladów rybosomu na mRNA od kodonu start do kodonu stop. Jednak dane z profilowania rybosomów często mają kilka problemów, w tym niskie i rzadkie odczyty sekwencjonowania wzdłuż ORF, wysoki szum sekwencjonowania i zanieczyszczenia rybosomalnym RNA (rRNA). W związku z tym zniekształcone i niejednoznaczne sygnały generowane przez takie dane osłabiają wzorce okresowości 3-nt śladów rybosomów na mRNA, co ostatecznie utrudnia identyfikację ORF o wysokim poziomie pewności.
Pakiet o nazwie "RiboCode" zaadaptował zmodyfikowany test rang ze znakiem Wilcoxona i strategię integracji wartości P, aby sprawdzić, czy ORF ma znacznie więcej fragmentów chronionych rybosomem w ramce (RPF) niż RPFy poza ramką22. Wykazano, że jest bardzo wydajny, czuły i dokładny w adnotacji de novo translatomu w symulowanych i rzeczywistych danych profilowania rybosomów. W tym miejscu opisujemy, jak używać tego narzędzia do wykrywania potencjalnych translacji ORF z surowych zestawów danych sekwencjonowania profilowania rybosomów wygenerowanych przez poprzednie badanie23. Te zestawy danych wykorzystano do zbadania funkcji podjednostki EIF3 "E" (EIF3E) w translacji poprzez porównanie profili zajmowania rybosomów komórek MCF-10A transfekowanych małymi interferującymi RNA (si-Ctrl) i EIF3E (si-eIF3e). Stosując RiboCode do tych przykładowych zestawów danych, wykryliśmy 5 633 nowe ORF-y potencjalnie kodujące małe peptydy lub białka. Te ORF zostały podzielone na różne typy w oparciu o ich lokalizację względem regionów kodujących, w tym ORF (uORF), ORF (dORF), nakładające się ORF, ORF z nowych genów kodujących białka (nowe PCG) i ORF-y z nowych genów niekodujących białek (nowe NonPCGs). Gęstości odczytu RPF na uORF były znacznie zwiększone w komórkach z niedoborem EIF3E w porównaniu z komórkami kontrolnymi, co może być przynajmniej częściowo spowodowane wzbogaceniem aktywnie translujących rybosomów. Zlokalizowana akumulacja rybosomu w regionie od 25. do 75. kodonu komórek z niedoborem EIF3E wskazywała na blokadę wydłużenia translacji we wczesnym stadium. Protokół ten pokazuje również, jak wizualizować gęstość RPF w pożądanym regionie w celu zbadania wzorców okresowości 3-nt śladów rybosomów na zidentyfikowanych ORF. Analizy te pokazują potężną rolę RiboCode w identyfikacji tłumaczących ORF i badaniu regulacji tłumaczenia.
Access restricted. Please log in or start a trial to view this content.
1. Konfiguracja środowiska i instalacja RiboCode
2. Przygotowanie danych
3. Przytnij adaptery i usuń zanieczyszczenie rRNA
4. Dopasuj czyste odczyty do genomu
5. Wybór rozmiaru RPFów i identyfikacja ich miejsc P
6. Adnotacja de novo tłumacząca ORFy
7. (Opcjonalnie) Kwantyfikacja i statystyki ORF
8. (Opcjonalnie) Wizualizacja przewidywanych ORFów
9. (Opcjonalnie) Analiza metagenów za pomocą RiboMiner
UWAGA: Przeprowadź analizę metagenu, aby ocenić wpływ knockdownu EIF3E na translację zidentyfikowanych adnotowanych ORF, wykonując poniższe czynności:
Access restricted. Please log in or start a trial to view this content.
Przykładowe zestawy danych profilowania rybosomów zostały zdeponowane w bazie danych GEO pod numerem dostępu GSE131074. Wszystkie pliki i kody używane w tym protokole są dostępne w plikach uzupełniających 1-4. Stosując RiboCode do zestawu opublikowanych zestawów danych profilowania rybosomów23, zidentyfikowaliśmy nowe ORF aktywnie ulegające translacji w komórkach MCF-10A traktowanych siRNA kontrolnym i EIF3E. Aby wybrać od...
Access restricted. Please log in or start a trial to view this content.
Profilowanie rybosomów daje bezprecedensową możliwość badania działania rybosomów w komórkach w skali genomu. Precyzyjne rozszyfrowanie informacji przenoszonych przez dane z profilowania rybosomów może dostarczyć informacji na temat tego, które regiony genów lub transkryptów aktywnie się tłumaczą. Ten protokół krok po kroku zawiera wskazówki dotyczące używania RiboCode do szczegółowej analizy danych profilowania rybosomów, w tym instalacji pakietów, przygotowania danych, wykonywania poleceń, wy...
Access restricted. Please log in or start a trial to view this content.
Autorzy nie mają do ujawnienia żadnych konfliktów interesów.
Autorzy pragną podziękować za wsparcie ze strony zasobów obliczeniowych dostarczanych przez platformę HPCC Uniwersytetu Xi'an Jiaotong. Z.X. dziękuje za Plan Wsparcia Młodych Talentów Uniwersytetu Xi'an Jiaotong.
Access restricted. Please log in or start a trial to view this content.
| Name | Company | Catalog Number | Comments |
|---|---|---|---|
| Komputer/serwer z systemem Linux | Any | - | - |
| Anaconda lub Miniconda | Anaconda-Anaconda | : https://www.anaconda.com; Miniconda:https://docs.conda.io/en/latest/miniconda.html | |
| R | R | Foundation-https://www.r-project.org/ | |
| Rstudio | Rstudio-https://www.rstudio.com/ |
Access restricted. Please log in or start a trial to view this content.
Request permission to reuse the text or figures of this JoVE article
Request Permission