Neste protocolo, descrevemos um procedimento contendo duas partes. Primeiro, um método de diferenciação de queratinócito 2D monocamado in vitro por inibição de contato. Em segundo lugar, sua caracterização molecular por RNA-seq.
O método de diferenciação in vitro 2D é simples e fácil de executar. Pode ser usado para estudar a diferenciação epidérmica, especialmente quando um grande número de células são necessárias. Por exemplo, na análise epigenômica.
O detalhado pipeline de análise RNA-seq é claro e transparente para pesquisadores com habilidades básicas de bioinformática, e pode ser usado para qualquer análise rna-seq em massa. Ao executar o protocolo de diferenciação pela primeira vez, tenha em mente que a densidade de semeadura pode ser complicada. Experimente várias densidades de semeadura para descobrir qual funciona melhor com sua linha celular.
Comece por preparar meio de crescimento de queratinócitos ou KGM e 500 mililitros cada um de meio de proliferação e meio de diferenciação de acordo com as instruções do manuscrito. Os queratinócitos primários de sementes a uma densidade de 5 a 20.000 células por centímetro ao quadrado e adicionam meio de proliferação suficiente para cobrir as células. Dois dias após a semeadura, refresque as células com o meio de proliferação.
Verifique as células regularmente sob o microscópio e atualize o meio a cada dois dias. Quando as células atingem 90% de confluência, induz a diferenciação alterando o meio para o meio de diferenciação. Para coletar células para novas análises de RNA, lave as células duas vezes com DPBS e, em seguida, adicione o tampão de lise.
Recolher células nos dias de diferenciação zero, dois, quatro e sete. Após o isolamento do RNA, o CDNA de dupla-encalha será convertido e as bibliotecas RNA-seq estarão preparadas para o sequenciamento da próxima geração. Após o sequenciamento, as leituras da sequência serão baixadas e mapeadas para o genoma humano.
Depois de baixar e instalar pacotes R, gere tabela de conta a partir do readspergene.out. tab files e escreva um arquivo de dados de amostra contendo todos os nomes de arquivos, o dia da diferenciação e outros dados de amostra relevantes. Consulte os arquivos de codificação suplementar para um exemplo.
Em seguida, use a tabela de contagem e os dados da amostra para gerar um objeto deseq2 contendo os dados contáveis e amostrais. Para normalização da expressão genética, normalize a tabela de contagem no objeto deseq2 usando a normalização deseq2RLD ou VST. Embora a normalização do RLD seja preferida, a normalização do VST é muito mais rápida.
Use a função dist em R para traçar a distância amostral com base nas intensidades de contagem de leitura normalizadas e, em seguida, realizar o agrupamento de hclust com base na distância da amostra. Em seguida, plote o mapa de calor usando a função pheatmap. Finalmente, gere uma análise de componentes principais ou gráfico PCA das intensidades de contagem de leitura normalizadas usando a função plotPCA do deseq2.
O PCA atua como uma ferramenta na análise exploratória de dados e pode ser usado para visualizar distância e conexão entre diferentes amostras. Realize uma análise de expressão genética altamente variável com a função rowVars que extrai os 500 genes altamente variáveis, ordenando a variância entre amostras de diferentes pontos de tempo. Esses genes têm o maior desvio padrão de sua intensidade normalizada em dias de diferenciação.
Realize agrupamento k-means nos genes altamente variáveis para agrupar-los por diferentes padrões de expressão. Visualize os genes em um mapa de calor com o pacote de featmap. A intensidade traçada no mapa de calor é a intensidade normalizada do deseq2 com o valor mediano subtraído.
Gere uma lista de genes de fundo expressos que inclui todos os genes com mais de 10 contagens em uma única amostra e faça uma lista com genes de cada cluster. Finalmente, realize a análise de Ontologia genética usando GOrilla. Use a lista de genes de fundo como conjunto de fundo e a lista dos genes altamente variáveis em clusters como o conjunto de destino e clique nos termos GO enriquecidos da pesquisa.
Alternativamente, usuários de R mais avançados podem usar o cluster de pacoteProfiler para automatizar a análise de enriquecimento de termos GO. Linhas de queratinócitos derivadas de cinco indivíduos foram utilizadas para diferenciação nas análises de RNA-seq. A análise dos componentes principais mostrou que os queratinócitos submetidos à diferenciação tinham perfis de expressão genética conectados, mas distintos.
Genes altamente variáveis foram agrupados para visualizar dinâmicas e padrões de expressão genética durante a diferenciação. Cada conjunto de genes foi representado pelos genes de diferenciação de queratinócitos e a anotação da Ontologia genética mostrou uma clara diferença nas funções genéticas. No segundo experimento, as diferenças de morfologia celular e expressão genética foram comparadas entre queratinócitos de controles saudáveis e linhas celulares derivadas de pacientes portadores de mutações P63.
A análise dos componentes principais mostrou que as linhas celulares de controle seguiram claramente um padrão de diferenciação, mas o padrão de expressão genética das células mutantes durante a diferenciação permanece em grande parte semelhante ao das células proliferadoras ou indiferenciadas. Na análise de agrupamento, os genes no cluster um foram regulados em células de controle e parcialmente regulados em células pacientes portadoras de mutações R204W e R279H, mas permaneceram altos em células portadoras de R304W. Esses genes provavelmente desempenham papéis na proliferação celular, como mostrado pela análise gene ontologia.
Os genes do cluster dois foram introduzidos pela primeira vez e, posteriormente, regulados em células de controle. Esses genes provavelmente estão envolvidos na diferenciação de queratinócitos, pois as funções de diferenciação epidérmica e queratinização foram altamente enriquecidas para este aglomerado. Genes no aglomerado três foram induzidos apenas no final da diferenciação nas células de controle, o que indica que eles podem desempenhar um papel na camada mais externa da epiderme.
Ao analisar os dados do RNA-seq, é importante saber de antemão o que esperar. Isso ajudará você tanto na interpretação do controle de qualidade quanto no enredo do PCA e na avaliação se seus resultados estão fazendo sentido. Nossos métodos podem ser usados para estudar a transcrição genética tanto na biologia epidérmica quanto em outros sistemas biológicos.