Zum Anzeigen dieser Inhalte ist ein JoVE-Abonnement erforderlich. Melden Sie sich an oder starten Sie Ihre kostenlose Testversion.
Method Article
* Diese Autoren haben gleichermaßen beigetragen
Übersetzende Ribosomen dekodieren drei Nukleotide pro Codon in Peptide. Ihre Bewegung entlang der mRNA, die durch Ribosomenprofilierung erfasst wird, erzeugt die Fußabdrücke, die eine charakteristische Triplettperiodizität aufweisen. Dieses Protokoll beschreibt, wie RiboCode verwendet werden kann, um dieses herausragende Merkmal aus Ribosom-Profiling-Daten zu entschlüsseln, um aktiv übersetzte offene Leserahmen auf der Ebene des gesamten Transkriptoms zu identifizieren.
Die Identifizierung von offenen Leserahmen (ORFs), insbesondere solcher, die für kleine Peptide kodieren und aktiv unter spezifischen physiologischen Kontexten übersetzt werden, ist entscheidend für umfassende Annotationen kontextabhängiger Translatomen. Ribosomenprofilierung, eine Technik zur Erkennung der Bindungsstellen und Dichten der Übersetzung von Ribosomen auf RNA, bietet eine Möglichkeit, schnell herauszufinden, wo die Translation auf genomweiter Ebene stattfindet. In der Bioinformatik ist es jedoch keine triviale Aufgabe, die übersetzenden ORFs für die Ribosomenprofilierung effizient und umfassend zu identifizieren. Hier wird ein einfach zu bedienendes Paket namens RiboCode beschrieben, das entwickelt wurde, um aktiv nach der Übersetzung von ORFs beliebiger Größe aus verzerrten und mehrdeutigen Signalen in Ribosomenprofilierungsdaten zu suchen. Am Beispiel unseres zuvor veröffentlichten Datensatzes bietet dieser Artikel Schritt-für-Schritt-Anleitungen für die gesamte RiboCode-Pipeline, von der Vorverarbeitung der Rohdaten bis zur Interpretation der endgültigen Ausgabeergebnisdateien. Darüber hinaus werden zur Bewertung der Translationsraten der annotierten ORFs Verfahren zur Visualisierung und Quantifizierung von Ribosomendichten auf jedem ORF detailliert beschrieben. Zusammenfassend ist der vorliegende Artikel eine nützliche und zeitgemäße Anleitung für die Forschungsbereiche Translation, kleine ORFs und Peptide.
In jüngster Zeit hat eine wachsende Zahl von Studien eine weit verbreitete Produktion von Peptiden gezeigt, die aus ORFs kodierender Gene und den zuvor annotierten Genen als nicht kodierend übersetzt wurden, wie z.B. lange nicht-kodierende RNAs (lncRNAs) 1,2,3,4,5,6,7,8. Diese übersetzten ORFs werden von Zellen reguliert oder induziert, um auf Umweltveränderungen, Stress und Zelldifferenzierung zu reagieren1,8,9,10,11,12,13. Es hat sich gezeigt, dass die Übersetzungsprodukte einiger ORFs eine wichtige regulatorische Rolle in verschiedenen biologischen Prozessen in Entwicklung und Physiologie spielen. Zum Beispiel entdeckten Chng et al.14 ein Peptidhormon namens Elabela (Ela, auch bekannt als Apela/Ende/Toddler), das für die kardiovaskuläre Entwicklung entscheidend ist. Pauli et al. schlugen vor, dass Ela auch als Mitogen wirkt, das die Zellmigration im frühen Fischembryo fördert15. Magny et al. berichteten über zwei Mikropeptide von weniger als 30 Aminosäuren, die den Kalziumtransport regulieren und die regelmäßige Muskelkontraktion im Drosophila-Herzen beeinflussen10.
Es bleibt unklar, wie viele solcher Peptide vom Genom kodiert werden und ob sie biologisch relevant sind. Daher ist eine systematische Identifizierung dieser potenziell kodierenden ORFs sehr wünschenswert. Die direkte Bestimmung der Produkte dieser ORFs (d.h. Protein oder Peptid) mit traditionellen Ansätzen wie evolutionärer Konservierung16,17 und Massenspektrometrie18,19 ist jedoch eine Herausforderung, da die Detektionseffizienz beider Ansätze von der Länge, Häufigkeit und Aminosäurezusammensetzung der produzierten Proteine oder Peptide abhängt. Das Aufkommen der Ribosomenprofilierung, einer Technik zur Identifizierung der Ribosomenbelegung auf mRNAs bei Nukleotidauflösung, hat eine präzise Möglichkeit geschaffen, das Kodierungspotenzial verschiedener Transkripte zu bewerten3,20,21, unabhängig von ihrer Länge und Zusammensetzung. Ein wichtiges und häufig verwendetes Merkmal zur Identifizierung aktiv übersetzender ORFs mithilfe von Ribosomenprofiling ist die Drei-Nukleotid-Periodizität (3-nt) der Fußabdrücke des Ribosoms auf mRNA vom Startcodon bis zum Stopp-Codon. Ribosom-Profiling-Daten haben jedoch oft mehrere Probleme, einschließlich niedriger und spärlicher Sequenzierungswerte entlang von ORFs, hohem Sequenzierungsrauschen und ribosomalen RNA (rRNA) -Kontaminationen. Daher schwächen die verzerrten und mehrdeutigen Signale, die von solchen Daten erzeugt werden, die 3-nt-Periodizitätsmuster der Fußabdrücke der Ribosomen auf mRNA, was letztendlich die Identifizierung der hochkonfidenzierten übersetzten ORFs erschwert.
Ein Paket namens "RiboCode" adaptierte einen modifizierten Wilcoxon-Sign-Rank-Test und eine P-Wert-Integrationsstrategie, um zu untersuchen, ob der ORF signifikant mehr Ribosomen-geschützte In-Frame-Fragmente (RPFs) aufweist als Off-Frame-RPFs22. Es erwies sich als hocheffizient, empfindlich und genau für die De-novo-Annotation des Translatoms in simulierten und realen Ribosomenprofilierungsdaten. Hier beschreiben wir, wie Sie dieses Tool verwenden, um die potenziellen übersetzenden ORFs aus den rohen Ribosom-Profiling-Sequenzierungsdatensätzen zu erkennen, die von der vorherigen Studie23 generiert wurden. Diese Datensätze wurden verwendet, um die Funktion der EIF3-Untereinheit "E" (EIF3E) in der Translation zu untersuchen, indem die Ribosomenbelegungsprofile von MCF-10A-Zellen, die mit Kontrolle (si-Ctrl) transfiziert wurden, und EIF3E (si-eIF3e) kleininterferierenden RNAs (siRNAs) verglichen wurden. Durch die Anwendung von RiboCode auf diese Beispieldatensätze haben wir 5.633 neuartige ORFs entdeckt, die möglicherweise für kleine Peptide oder Proteine kodieren. Diese ORFs wurden basierend auf ihren Standorten relativ zu den kodierenden Regionen in verschiedene Typen eingeteilt, darunter Upstream-ORFs (uORFs), Downstream-ORFs (dORFs), überlappende ORFs, ORFs aus neuartigen proteinkodierenden Genen (neuartige PCGs) und ORFs aus neuartigen nichtproteinkodierenden Genen (neuartige NonPCGs). Die RPF-Lesedichten auf uORFs waren in EIF3E-defizienten Zellen im Vergleich zu Kontrollzellen signifikant erhöht, was zumindest teilweise durch die Anreicherung von aktiv übersetzenden Ribosomen verursacht werden könnte. Die lokalisierte Ribosom-Akkumulation in der Region vom 25. bis 75. Codon von EIF3E-defizienten Zellen deutete auf eine Blockade der Translationsdehnung im Frühstadium hin. Dieses Protokoll zeigt auch, wie die RPF-Dichte der gewünschten Region visualisiert werden kann, um die 3-nt-Periodizitätsmuster von Ribosomen-Fußabdrücken auf identifizierten ORFs zu untersuchen. Diese Analysen zeigen die mächtige Rolle von RiboCode bei der Identifizierung von übersetzenden ORFs und der Untersuchung der Regulierung der Übersetzung.
1. Einrichtung der Umgebung und Installation von RiboCode
2. Datenaufbereitung
3. Adapter trimmen und rRNA-Verunreinigungen entfernen
4. Richten Sie die sauberen Lesevorgänge am Genom aus
5. Größenauswahl der RPFs und Identifizierung ihrer P-Standorte
6. De novo annotate Übersetzung von ORFs
7. (Optional) ORF-Quantifizierung und Statistik
8. (Optional) Visualisierung der vorhergesagten ORFs
9. (Optional) Metagenanalyse mit RiboMiner
HINWEIS: Führen Sie die Metagenanalyse durch, um den Einfluss des EIF3E-Knockdowns auf die Translation identifizierter annotierter ORFs zu bewerten, indem Sie die folgenden Schritte ausführen:
Die Beispiel-Ribosom-Profiling-Datensätze wurden in der GEO-Datenbank unter der Zugangsnummer GSE131074 hinterlegt. Alle Dateien und Codes, die in diesem Protokoll verwendet werden, sind unter Ergänzende Dateien 1-4 verfügbar. Durch die Anwendung von RiboCode auf eine Reihe von veröffentlichten Ribosom-Profiling-Datensätzen23 identifizierten wir die neuartigen ORFs, die aktiv in MCF-10A-Zellen übersetzt wurden, die mit Kontroll- und EIF3...
Die Ribosomen-Profilierung bietet eine beispiellose Gelegenheit, die Wirkung der Ribosomen in Zellen auf Genomebene zu untersuchen. Die genaue Entschlüsselung der Informationen, die von den Ribosom-Profiling-Daten enthalten sind, könnte Aufschluss darüber geben, welche Regionen von Genen oder Transkripten aktiv übersetzt werden. Dieses Schritt-für-Schritt-Protokoll bietet Anleitungen zur Verwendung von RiboCode zur detaillierten Analyse von Ribosomenprofilierungsdaten, einschließlich Paketinstallation, Datenvorbere...
Die Autoren haben keine Interessenkonflikte offenzulegen.
Die Autoren möchten die Unterstützung durch die Rechenressourcen der HPCC-Plattform der Xi'an Jiaotong University würdigen. Z.X. dankt dem Young Topnotch Talent Support Plan der Xi'an Jiaotong Universität.
Name | Company | Catalog Number | Comments |
A computer/server running Linux | Any | - | - |
Anaconda or Miniconda | Anaconda | - | Anaconda: https://www.anaconda.com; Miniconda:https://docs.conda.io/en/latest/miniconda.html |
R | R Foundation | - | https://www.r-project.org/ |
Rstudio | Rstudio | - | https://www.rstudio.com/ |
Genehmigung beantragen, um den Text oder die Abbildungen dieses JoVE-Artikels zu verwenden
Genehmigung beantragenThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Alle Rechte vorbehalten