5.2K Views
•
08:35 min
•
June 24th, 2021
DOI :
June 24th, 2021
•Transkript
Dieses Protokoll bietet ein umfassendes Verständnis von Genisoformen, die durch alternatives Spleißen und Polyadenylierung erzeugt werden, indem es einen schrittweisen Workflow zur Identifizierung differentieller Spleißstellen, differentiell exprimierter Exons und Poly(A)-Stellen bereitstellt. Der Hauptvorteil dieses Protokolls besteht darin, dass es sowohl Exon-basierte als auch ereignisbasierte Methoden zur Untersuchung des alternativen Spleißens evaluiert. Es wendet auch eine Exon-basierte Methode an, um alternative Polyadenylierung zu untersuchen.
Die R-Markdown-Dateien, die die Codes und Notizen für die AS- und AP-Analyse enthalten, wurden bereitgestellt. Es wäre ratsam, die Schritte in der R Markdown-Datei zu befolgen und die Notiz für jeden Schritt sorgfältig zu erreichen. Um das differentielle Spleißen mit diffSplice aus limma zu identifizieren, folgen Sie der R-Notebook-Datei.
Bereiten Sie die Eingabedateien wie im Textmanuskript beschrieben vor. Stellen Sie sicher, dass die Schritte eins bis drei im Manuskript nacheinander befolgt wurden, um Eingabedateien vorzubereiten, bevor Sie fortfahren. Laden Sie zunächst die erforderlichen Bibliotheken.
Um eine unspezifische Filterung durchzuführen, extrahieren Sie zunächst die zuvor erhaltene Matrix der Lesezähler und erstellen Sie eine Liste von Features mit der DGEList-Funktion aus dem edgeR-Paket, wobei Zeilen Gene und Spalten Proben darstellen. Transformieren Sie dann die Daten mithilfe der CPM-Funktion aus dem edgeR-Paket von der Rohskala in Zählungen pro Million und behalten Sie Exons mit Zählungen über einem einstellbaren Schwellenwert bei. Dieser Datensatz enthält sechs Beispiele.
Daher wird der CPM auf mehr als eine und mindestens drei von sechs Stichproben festgelegt. Normalisieren Sie die Zählungen über Stichproben hinweg mit der calcNormFactors-Funktion aus dem edgeR-Paket unter Verwendung von Trimmed Mean of M-Werten. Diese Funktion berechnet Skalierungsfaktoren, um Bibliotheksgrößen anzupassen.
Verwenden Sie die zuvor generierte Beispieltabelle, um die Entwurfsmatrix zu erstellen, um die experimentellen Bedingungen für jede Probe zu definieren. Führen Sie die voom-Funktion des limma-Pakets aus, um RNA-Sequenzierungsdaten zu verarbeiten und die Varianz zu schätzen. Diese Funktion generiert Präzisionsgewichte zur Korrektur von Poisson-Zählrauschen und wandelt die Exon-Level-Zählungen in zwei Zählungen pro Million oder logCPM um.
Führen Sie die lmfit-Funktion aus, um lineare Modelle an die Ausdrucksdaten für jedes Exon anzupassen. Führen Sie dann die eBayes-Funktion aus, um empirische Statistiken für das angepasste Modell zu berechnen, um differentielle Exonausdrücke zu erkennen. Definieren Sie eine Kontrastmatrix für die experimentellen Vergleiche von Interesse.
Verwenden Sie die Kontraste. Fit-Funktion, um Koeffizienten und Standardfehler für jedes Vergleichspaar zu erhalten. Führen Sie diffSplice auf dem angepassten Modell aus, um die Unterschiede in der Exon-Verwendung von Genen zwischen Wildtyp und Knockout zu testen.
Untersuchen Sie die am besten bewerteten Ergebnisse mit der topSplice-Funktion, wobei ein Test gleich t eine Rangfolge von AS-Exons und ein Test gleich Simes eine Rangfolge von Genen ergibt. Führen Sie die plotSplice-Funktion aus, um die Ergebnisse zu plotten. Wenn man das interessierende Gen in das Gen-ID-Argument einfügt, zeigen die roten Punkte die differentiell exprimierten Exons.
Generieren Sie ein Vulkandiagramm mit dem EnhancedVolcano-Bioleiterpaket, um die differentiell exprimierten Exons darzustellen. Um rMATS zu verwenden, stellen Sie sicher, dass die neueste Version von rMATS Version 4.1.1 entweder mit conda oder GitHub im Arbeitsverzeichnis installiert ist. Wechseln Sie zu dem Ordner, der die BAM-Dateien enthält, die nach der Zuordnung abgerufen wurden.
Bereiten Sie Textdateien gemäß den Anforderungen von rMATS für die beiden Bedingungen vor, bei denen der Name von BAM-Dateien und deren Pfad durch ein Komma getrennt kopiert werden. Führen Sie rmas aus. py verwendet die beiden generierten Eingabetextdateien, die den Pfad der BAM-Dateien und die Anmerkung beschreiben.
GTF-Datei zuvor erhalten. Dadurch wird ein Ausgabeordner rmats_out generiert, der Textdateien enthält, die Statistiken beschreiben, einschließlich P-Werte und Einschlussstufen für jedes Spleißereignis separat. Verwenden Sie den Bioconductor Package Maser, um die rMATS-Ergebnisse zu untersuchen.
Laden Sie die Junction- und Exon-Counts-Textdateien mit der Erweiterung JCEC in das Maser-Objekt und schließen Sie mindestens fünf durchschnittliche Lesevorgänge pro Spleißereignis ein, um das Ergebnis basierend auf der Abdeckung zu filtern. Um die rMATS-Ergebnisse zu visualisieren, führen Sie zunächst die Funktion topEvents aus dem Maser-Paket aus und wählen Sie die signifikanten Spleißereignisse mit einer False-Discovery-Rate von 10 % und einer Mindeständerung von 10 % in Prozent gespleißt oder PSI aus. Überprüfen Sie die Genereignisse für einzelne Gene von Interesse und zeichnen Sie PSI-Werte für jedes Spleißereignis dieses Gens.
Generieren Sie ein Vulkandiagramm, indem Sie den Ereignistyp angeben. Verwenden Sie die mit rMATS erhaltenen Ergebnisse von Spleißereignissen in Form von Textdateien, um Sashimi-Plots mit dem Paket rmats2sashimiplot zu generieren. Das Sashimi-Diagramm zeigt ein übersprungenes Exon-Ereignis im Wnk1-Gen.
Jede Zeile repräsentiert eine RNA-seq-Probe, drei Replikate des Wildtyps und Mbnl1-Knockout. Die Höhe zeigt die Leseabdeckung in RPKM und die Verbindungsbögen zeigen Verbindungslesevorgänge über Exons hinweg. Der untere Teil zeigt annotierte alternative Isoformen des Genmodells.
Eine signifikante Faltenänderung und starke statistische Beweise für echte Unterschiede können in den Genen beobachtet werden, die sich im oberen linken oder rechten Quadranten der Vulkandiagramme befinden, die mit diffSplice und DEXSeq erhalten wurden. Es wurde festgestellt, dass ein Kassettenexon zwischen verschiedenen Bedingungen für das Gen Wnk1 variiert. Das Differential-Exon-Nutzungsdiagramm zeigte Hinweise auf differentielles Spleißen an fünf Exon-Stellen in der Nähe von Wnk1.6.45, wobei die rosa hervorgehobenen Exons wahrscheinlich in Mbnl1-Knockout-Proben im Vergleich zum Wildtyp ausgespleißt wurden.
Das Vulkandiagramm von Genen, die alternativ gespleißt werden, half bei der Unterscheidung zwischen den Genen, die vom Wildtyp ausgeschlossen wurden, und denen, die in den Wildtyp eingeschlossen waren. Die Arten von Spleißereignissen SE, A5SS, A3SS, MXE und RI wurden unter Verwendung von Sashimi-Diagrammen der wichtigsten Gene dieser Ereignisse visualisiert. Die differentielle APA-Aktivität in drei primären untranslatierten Genregionen wurde anhand von Vulkandiagrammen beobachtet.
Die signifikant unterschiedlichen PA-Standortnutzungsergebnisse, die von verschiedenen Pipelines erfasst wurden, wurden mittels Ereignisdiagramm visualisiert. Eine signifikante distale bis proximale Verschiebung der PA-Standortnutzung bei Doppel-Knockouts kann in beiden Genen FOSL1 und Papola beobachtet werden. Die mittlere Abdeckung in flankierenden Regionen, die an bekannten PA-Spaltungsstellen auf genomweiter Ebene verankert sind, wurde mit Hilfe eines diagnostischen Diagramms bestimmt.
Stellen Sie sicher, dass die Parameter wie transspezifische Informationen und Mehrfachüberlappung zulassen beim Generieren von Zählmetriken korrekt verwendet werden. Die lineare Modellanpassung und das Erzeugen von Kontrastpaaren ist wichtig für den richtigen Vergleich. Stellen Sie für rMITS sicher, dass alle Parameter gemäß Ihren Daten korrekt eingestellt sind, bevor Sie den Befehl ausführen.
Die Gene, die aus der differentiellen Spleißaktivität gewonnen werden, könnten verwendet werden, um eine Gensatzanreicherungsanalyse durchzuführen. Ein weiteres Tool namens MISO könnte für weitere ereignisbasierte Analysen verwendet werden.
Alternative Spleißen (AS) und alternative Polyadenylierung (APA) erweitern die Vielfalt der Transkriptisoformen und ihrer Produkte. Hier beschreiben wir bioinformatische Protokolle zur Analyse von Bulk-RNA-seq und 3'-Endsequenzierungsassays, um AS und APA zu erkennen und zu visualisieren, die unter experimentellen Bedingungen variieren.
Weitere Videos entdecken
Kapitel in diesem Video
0:05
Introduction
0:51
Alternative Splicing (AS) Analysis Using RNA-Seq
6:02
Results: Alternative Splicing and Polyadenylation in RNA-Seq Data
7:46
Conclusion
Ähnliche Videos
Copyright © 2025 MyJoVE Corporation. Alle Rechte vorbehalten