En este protocolo, describimos un procedimiento que contiene dos partes. En primer lugar, un método de diferenciación monocapa de queratinocitos 2D in vitro por inhibición del contacto. En segundo lugar, su caracterización molecular por RNA-seq.
El método de diferenciación in vitro 2D es sencillo y fácil de realizar. Se puede utilizar para estudiar la diferenciación epidérmica, especialmente cuando un gran número de células son necesarias. Por ejemplo, en el análisis epigenómico.
La canalización detallada de análisis de ARN-seq es clara y transparente para investigadores con habilidades bioinformáticas básicas, y se puede utilizar para cualquier análisis de ARN-seq a granel. Al realizar el protocolo de diferenciación por primera vez, tenga en cuenta que la densidad de siembra puede ser complicada. Pruebe múltiples densidades de siembra para averiguar cuál funciona mejor con su línea celular.
Comience preparando el medio de crecimiento de queratinocitos o KGM y 500 mililitros cada uno de medio de proliferación y medio de diferenciación según las instrucciones del manuscrito. Sembrar queratinocitos primarios a una densidad de 5 a 20.000 células por centímetro cuadrado y añadir suficiente medio de proliferación para cubrir las células. Dos días después de la siembra, refresque las células con el medio de proliferación.
Revise las células regularmente bajo el microscopio y refresque el medio cada dos días. Cuando las células alcanzan el 90% de confluencia, induzcan la diferenciación cambiando el medio al medio de diferenciación. Para recolectar células para análisis adicionales de ARN, lave las células dos veces con DPBS y luego agregue el búfer de lelisis.
Recoger células en los días de diferenciación cero, dos, cuatro y siete. Después del aislamiento de ARN, se convertirá el ADNn a dos cadenas y se prepararán las bibliotecas RNA-seq para la secuenciación de próxima generación. Después de la secuenciación, las lecturas de secuencia serán descargadas y mapeadas al genoma humano.
Después de descargar e instalar paquetes de R, genere la tabla de cuentas a partir de readspergene.out. tabulación y escribir un archivo de datos de ejemplo que contenga todos los nombres de archivo, el día de la diferenciación y otros datos de ejemplo relevantes. Consulte los archivos de codificación suplementarios para obtener un ejemplo.
A continuación, utilice la tabla de recuento y los datos de ejemplo para generar un objeto deseq2 que contenga los datos contables y de ejemplo. Para la normalización de la expresión génica, normalice la tabla de recuento en el objeto deseq2 utilizando la normalización deseq2RLD o VST. Mientras que se prefiere la normalización RLD, la normalización VST es mucho más rápida.
Utilice la función dist en R para trazar la distancia de la muestra en función de las intensidades de recuento de lectura normalizadas y, a continuación, realice la agrupación en clústeres hclust en función de la distancia de la muestra. A continuación, trace el mapa de calor utilizando la función pheatmap. Por último, genere un análisis de componentes de principio o una gráfica PCA de las intensidades de recuento de lectura normalizadas utilizando la función plotPCA de deseq2.
PCA sirve como una herramienta en el análisis de datos exploratorios y se puede utilizar para visualizar la distancia y la conexión entre diferentes muestras. Realice análisis de expresión génica altamente variable con la función rowVars que extrae los 500 genes superiores altamente variables ordenando la varianza entre muestras de diferentes puntos de tiempo. Estos genes tienen la desviación estándar más alta de su intensidad normalizada a través de días de diferenciación.
Realice la agrupación en clústeres k-means en los genes altamente variables para agruparlos mediante diferentes patrones de expresión. Visualice los genes en un mapa de calor con el paquete pheatmap. La intensidad trazada en el mapa de calor es la intensidad normalizada deseq2 con el valor medio restado.
Generar una lista de genes de fondo expresados que incluye todos los genes con más de 10 recuentos en una sola muestra y hacer una lista con genes de cada grupo. Por último, realice el análisis de Gene Ontology con GOrilla. Utilice la lista de genes de fondo como conjunto de fondo y la lista de los genes altamente variables en clústeres como el conjunto de objetivos y, a continuación, haga clic en términos GO enriquecidos en la búsqueda.
Como alternativa, los usuarios de R más avanzados pueden usar el paquete clusterProfiler para automatizar el análisis de enriquecimiento de términos GO. Las líneas de queratinocito derivadas de cinco individuos se utilizaron para la diferenciación en los análisis de ARN-seq. El análisis de componentes principales mostró que los queratinocitos sometidos a diferenciación tenían perfiles de expresión génica globales relacionados pero distintos.
Los genes altamente variables se agruparon para visualizar la dinámica y los patrones de expresión génica durante la diferenciación. Cada grupo de genes estaba representado por los genes distintivos de la diferenciación de queratinocitos y la anotación Gene Ontology mostró una clara diferencia en las funciones genéticas. En el segundo experimento, se compararon las diferencias de morfología celular y expresión génica entre los queratinocitos de los controles sanos y las líneas celulares derivadas de pacientes portadores de mutaciones P63.
El análisis de componentes principales mostró que las líneas celulares de control seguían claramente un patrón de diferenciación, pero el patrón de expresión génica de las células mutantes durante la diferenciación permanece en gran medida similar al de las células proliferantes o indiferenciadas. En el análisis de agrupación, los genes en el clúster uno fueron regulados hacia abajo en las células de control y parcialmente regulados en células de pacientes portadoras de mutaciones R204W y R279H, pero se mantuvieron altos en células portadoras de R304W. Es probable que estos genes desempeñe un papel en la proliferación celular, como lo muestra el análisis de Gene Ontology.
Los dos genes del grupo se introdujeron por primera vez y posteriormente se regularon en las células de control. Es probable que estos genes participen en la diferenciación de queratinocitos, ya que las funciones de diferenciación epidérmica y queratinización se enriquecieron para este grupo. Los genes del grupo tres sólo fueron inducidos al final de la diferenciación en las células de control, lo que indica que pueden desempeñar un papel en la capa más externa de la epidermis.
Al analizar los datos de ARN-seq, es importante saber de antemano qué esperar. Esto le ayudará tanto con la interpretación del control de calidad y la gráfica PCA y en la evaluación de si sus resultados tienen sentido. Nuestros métodos se pueden utilizar para estudiar la transcripción genética tanto en biología epidérmica como en otros sistemas biológicos.