Dans ce protocole, nous décrivons une procédure contenant deux parties. Tout d’abord, une méthode de différenciation monocouche de kératinocyte 2D in vitro par inhibition de contact. Deuxièmement, sa caractérisation moléculaire par ARN-seq.
La méthode de différenciation in vitro 2D est simple et facile à exécuter. Il peut être utilisé pour étudier la différenciation épidermique, surtout quand un grand nombre de cellules sont nécessaires. Par exemple, dans l’analyse épigénomique.
Le pipeline détaillé d’analyse ARN-seq est clair et transparent pour les chercheurs ayant des compétences bioinformatiques de base, et il peut être utilisé pour n’importe quelle analyse en vrac de l’ARN-seq. Lorsque vous effectuez le protocole de différenciation pour la première fois, gardez à l’esprit que la densité d’ensemencement peut être délicate. Essayez plusieurs densités d’ensemencement pour savoir lequel fonctionne le mieux avec votre lignée cellulaire.
Commencez par préparer le milieu de croissance des kératinocytes ou KGM et 500 millilitres chacun de milieu de prolifération et de différenciation selon les directions manuscrites. Graines kératinocytes primaires à une densité de 5 à 20.000 cellules par centimètre au carré et ajouter suffisamment de milieu de prolifération pour couvrir les cellules. Deux jours après l’ensemencement, rafraîchir les cellules avec le milieu de prolifération.
Vérifiez régulièrement les cellules au microscope et rafraîchissez-vous moyen tous les deux jours. Lorsque les cellules atteignent 90% de confluence, induire la différenciation en changeant le milieu au milieu de différenciation. Pour recueillir les cellules pour d’autres analyses d’ARN, lavez les cellules deux fois avec DPBS, puis ajoutez le tampon de lyse.
Recueillir les cellules les jours de différenciation zéro, deux, quatre et sept. Après l’isolement de l’ARN, l’ADND à double brin sera convertie et les bibliothèques d’ARN-seq seront préparées pour le séquençage de prochaine génération. Après le séquençage, les lectures de la séquence seront téléchargées et cartographiées sur le génome humain.
Après le téléchargement et l’installation de paquets R, générer la table de compte à partir de readspergene.out. ongletz les fichiers et écrivez un fichier de données d’échantillon contenant tous les noms de fichiers, le jour de la différenciation et d’autres données d’échantillons pertinentes. Référez-vous aux fichiers de codage supplémentaires pour un exemple.
Utilisez ensuite la table de comptage et les données de l’échantillon pour générer un objet deseq2 contenant à la fois les données dénombrées et les données de l’échantillon. Pour la normalisation de l’expression des gènes, normalisez la table de comptage de l’objet deseq2 en utilisant soit la normalisation deseq2RLD, soit la normalisation VST. Bien que la normalisation rld soit préférable, la normalisation du TVV est beaucoup plus rapide.
Utilisez la fonction dist en R pour tracer la distance de l’échantillon en fonction des intensités normalisées du nombre de lecture, puis effectuez le clustering hclust en fonction de la distance de l’échantillon. Ensuite, tracez la carte thermique à l’aide de la fonction pheatmap. Enfin, générer une analyse des composants principaux ou une parcelle PCA des intensités normalisées du nombre de lecture en utilisant la fonction plotPCA de deseq2.
PcA sert d’outil dans l’analyse exploratoire des données et peut être utilisé pour visualiser la distance et la connexion entre les différents échantillons. Effectuez une analyse d’expression génétique très variable avec la fonction rowVars qui extrait les 500 gènes les plus variables en commander sur la variance entre les échantillons à partir de différents points de temps. Ces gènes ont l’écart type le plus élevé de leur intensité normalisée à travers les jours de différenciation.
Effectuez le clustering k-means sur les gènes hautement variables pour les regrouper par différents modèles d’expression. Visualisez les gènes dans une carte thermique avec le paquet pheatmap. L’intensité tracée dans la carte thermique est l’intensité normalisée deseq2 avec la valeur médiane soustraite.
Générer une liste de gènes de fond exprimés qui comprend tous les gènes avec plus de 10 dénombrements dans un seul échantillon et faire une liste avec des gènes de chaque cluster. Enfin, effectuer l’analyse de l’ontologie génétique à l’aide de GOrilla. Utilisez la liste des gènes d’arrière-plan comme ensemble d’arrière-plan et la liste des gènes hautement variables dans les clusters comme cible, puis cliquez sur les termes GO enrichis de recherche.
Alternativement, les utilisateurs R plus avancés peuvent utiliser le clusterProfiler de paquet pour automatiser l’analyse d’enrichissement à terme GO. Des lignées de kératinocytes dérivées de cinq individus ont été employées pour la différenciation dans des analyses d’ARN-seq. L’analyse principale de composant a prouvé que les kératinocytes subissant la différenciation avaient relié mais distincts profils globaux d’expression de gène.
Des gènes très variables ont été regroupés pour visualiser la dynamique et les modèles d’expression génétique pendant la différenciation. Chaque groupe de gènes était représenté par les gènes caractéristiques de différenciation des kératinocytes et l’annotation de gene ontologie a montré une nette différence dans les fonctions génétiques. Dans la deuxième expérience, la morphologie cellulaire et les différences d’expression des gènes ont été comparées entre les kératinocytes provenant de contrôles sains et les lignées cellulaires dérivées de patients porteurs de mutations P63.
L’analyse principale de composant a prouvé que les lignes de cellules de contrôle ont clairement suivi un modèle de différenciation, mais le modèle d’expression de gène des cellules mutantes pendant la différenciation reste en grande partie semblable à celui des cellules proliférantes ou indifférenciées. Dans l’analyse de clustering, les gènes dans le groupe un ont été downregulated dans les cellules témoins et partiellement downregulated dans les cellules patientes portant des mutations de R204W et de R279H, mais sont restés élevés dans les cellules portant R304W. Ces gènes jouent probablement un rôle dans la prolifération cellulaire, comme le montre l’analyse de Gene Ontology.
Les gènes de la grappe deux ont d’abord été introduits, puis régulés dans les cellules de contrôle. Ces gènes sont probablement impliqués dans la différenciation des kératinocytes car les fonctions épidermiques de différenciation et de kératinisation ont été fortement enrichies pour ce cluster. Les gènes du groupe trois n’ont été induits qu’à la fin de la différenciation dans les cellules de contrôle, ce qui indique qu’ils peuvent jouer un rôle dans la couche la plus externe de l’épiderme.
Lors de l’analyse des données arn-seq, il est important de savoir à l’avance à quoi s’attendre. Cela vous aidera à la fois à interpréter le contrôle de la qualité et le tracé pca et à évaluer si vos résultats sont logiques. Nos méthodes peuvent être utilisées pour étudier la transcription des gènes à la fois en biologie épidermique ainsi que dans d’autres systèmes biologiques.