In diesem Protokoll beschreiben wir ein Verfahren, das zwei Teile enthält. Erstens eine monolayer 2D-Keratinozytendifferenzierungsmethode in vitro durch Kontakthemmung. Zweitens, seine molekulare Charakterisierung durch RNA-seq.
Die 2D-In-vitro-Differenzierungsmethode ist einfach und einfach durchzuführen. Es kann verwendet werden, um epidermale Differenzierung zu studieren, vor allem, wenn eine große Anzahl von Zellen notwendig sind. Zum Beispiel in der epigenomischen Analyse.
Die detaillierte RNA-Seq-Analyse-Pipeline ist klar und transparent für Forscher mit grundlegenden Bioinformatik-Fähigkeiten und kann für jede Massen-RNA-Seq-Analyse verwendet werden. Beachten Sie bei der erstmaligen Durchführung des Differenzierungsprotokolls, dass die Aussaatdichte schwierig sein kann. Probieren Sie mehrere Sädichten aus, um herauszufinden, welche mit Ihrer Zelllinie am besten funktioniert.
Beginnen Sie mit der Vorbereitung keratinozyten Wachstumsmedium oder KGM und 500 Milliliter jeweils Proliferationsmedium und Differenzierungsmedium nach Manuskriptrichtungen. Samen primäre Keratinozyten mit einer Dichte von 5 bis 20 000 Zellen pro Zentimeter quadratisch und fügen genug Proliferationsmedium, um die Zellen zu decken. Zwei Tage nach der Aussaat die Zellen mit dem Proliferationsmedium erfrischen.
Überprüfen Sie die Zellen regelmäßig unter dem Mikroskop und erfrischen Medium jeden zweiten Tag. Wenn die Zellen eine Konfluenz von 90 % erreichen, induzieren Sie eine Differenzierung, indem Sie das Medium in das Differenzierungsmedium ändern. Um Zellen für weitere RNA-Analysen zu sammeln, waschen Sie die Zellen zweimal mit DPBS und fügen Sie dann einen Lysepuffer hinzu.
Sammeln Sie Zellen an den Differenzierungstagen Null, zwei, vier und sieben. Nach der RNA-Isolation werden doppelsträngige cDNA umgewandelt und RNA-Seq-Bibliotheken für die Sequenzierung der nächsten Generation vorbereitet. Nach der Sequenzierung werden die Sequenzlesungen heruntergeladen und dem menschlichen Genom zugeordnet.
Nach dem Herunterladen und Installieren von R-Paketen, generieren Sie eine Kontotabelle aus der readpergene.out. und schreiben Sie eine Beispieldatendatei mit allen Dateinamen, dem Tag der Differenzierung und anderen relevanten Beispieldaten. Ein Beispiel finden Sie in den zusätzlichen Codierungsdateien.
Verwenden Sie dann die Zähltabelle und die Beispieldaten, um ein Deseq2-Objekt zu generieren, das sowohl die zählbaren als auch die Beispieldaten enthält. Normalisieren Sie für die Normalisierung der Genexpression die Zähltabelle im deseq2-Objekt entweder mit Deseq2RLD- oder VST-Normalisierung. Während die RLD-Normalisierung bevorzugt wird, ist die VST-Normalisierung viel schneller.
Verwenden Sie die dist-Funktion in R, um den Stichprobenabstand basierend auf den normalisierten Lesezählintensitäten zu zeichnen und dann hclust clustering basierend auf dem Stichprobenabstand durchzuführen. Zeichnen Sie als Nächstes die Heatmap mit der pheatmap-Funktion. Schließlich generieren Sie eine Prinzipkomponentenanalyse oder ein PCA-Diagramm der normalisierten Lesezählintensitäten mit der plotPCA-Funktion von deseq2.
PCA dient als Werkzeug in der explorativen Datenanalyse und kann verwendet werden, um Entfernung und Verbindung zwischen verschiedenen Proben zu visualisieren. Führen Sie eine hochvariable Genexpressionsanalyse mit der rowVars-Funktion durch, die die Top 500 hochvariablen Gene extrahiert, indem sie die Varianz zwischen Proben aus verschiedenen Zeitpunkten ordnet. Diese Gene weisen die höchste Standardabweichung ihrer normalisierten Intensität über Tage der Differenzierung auf.
Führen Sie k-means Clustering auf den hochvariablen Genen durch, um sie nach verschiedenen Expressionsmustern zu gruppieren. Visualisieren Sie die Gene in einer Heatmap mit dem pheatmap-Paket. Die in der Heatmap dargestellte Intensität ist die normalisierte Deseq2-Intensität mit subtrahierter Medianwert.
Generieren Sie eine Liste der exprimierten Hintergrundgene, die alle Gene mit mehr als 10 Zählungen in einer einzigen Probe enthält, und erstellen Sie eine Liste mit Genen aus jedem Cluster. Führen Sie schließlich eine Gene Ontology-Analyse mit GOrilla durch. Verwenden Sie die Hintergrundgenliste als Hintergrundsatz und die Liste der hochvariablen Gene in Clustern als Zielsatz, und klicken Sie dann auf suchangereicherte GO-Begriffe.
Alternativ können fortgeschrittenere R-Benutzer den PaketclusterProfiler verwenden, um die GO-Terminologieanreicherungsanalyse zu automatisieren. Keratinozytenlinien, die von fünf Individuen abgeleitet wurden, wurden zur Differenzierung in RNA-Seq-Analysen verwendet. Die Hauptkomponentenanalyse zeigte, dass Keratinozyten, die sich einer Differenzierung unterziehen, unterschiedliche allgemeine Genexpressionsprofile miteinander verbunden hatten.
Hochvariable Gene wurden gruppiert, um die Dynamik und Muster der Genexpression während der Differenzierung zu visualisieren. Jeder Gencluster wurde durch die Keratinozytendifferenzierungs-Kennzeichengene repräsentiert und die Gene Ontology-Anmerkung zeigte einen deutlichen Unterschied in den Genfunktionen. Im zweiten Experiment wurden Zellmorphologie und Genexpressionsunterschiede zwischen Keratinozyten aus gesunden Kontrollen und Zelllinien von Patienten mit P63-Mutationen verglichen.
Die Hauptkomponentenanalyse zeigte, dass die Kontrollzelllinien eindeutig einem Differenzierungsmuster folgten, aber das Genexpressionsmuster mutierter Zellen während der Differenzierung bleibt weitgehend dem von proliferierenden oder undifferenzierten Zellen ähnlich. In der Clustering-Analyse wurden Gene in Cluster eins in Kontrollzellen und teilweise downreguliert in Patientenzellen, die R204W- und R279H-Mutationen trugen, aber in Zellen, die R304W trugen, hoch verblieben. Diese Gene spielen wahrscheinlich eine Rolle bei der Zellproliferation, wie die Gene Ontology-Analyse zeigt.
Cluster zwei Gene wurden zuerst eingeführt und anschließend in Kontrollzellen nach unten reguliert. Diese Gene sind wahrscheinlich an der Keratinozytendifferenzierung beteiligt, da epidermale Differenzierungs- und Keratinisierungsfunktionen für diesen Cluster stark angereichert waren. Gene in Cluster drei wurden erst am Ende der Differenzierung in Kontrollzellen induziert, was darauf hindeutet, dass sie eine Rolle in der äußersten Schicht der Epidermis spielen können.
Bei der Analyse von RNA-seq-Daten ist es wichtig, vorher zu wissen, was zu erwarten ist. Dies wird Ihnen sowohl bei der Interpretation der Qualitätskontrolle und des PCA-Plots als auch bei der Bewertung helfen, ob Ihre Ergebnisse sinnvoll sind. Unsere Methoden können sowohl in der epidermalen Biologie als auch in anderen biologischen Systemen zur Untersuchung der Gentranskription eingesetzt werden.