在此协议中,我们描述了一个包含两个部分的过程。首先,单层2D角蛋白细胞分化方法在体外通过接触抑制。其次,其分子特征由RNA-seq。
2D 体外分化方法简单易用。它可用于研究表皮分化,特别是当大量的细胞是必要的。例如,在表观分析中。
详细的RNA-seq分析管道对于具有基本生物信息学技能的研究人员来说是清晰透明的,可用于任何散装RNA-seq分析。首次执行分化协议时,请记住,播种密度可能比较棘手。尝试多个种子密度,找出哪一个最适合您的细胞系。
首先根据手稿方向制备角蛋白细胞生长介质或 KGM 和 500 毫升增殖介质和分化介质。种子原发性角蛋白细胞密度为每厘米5至2万细胞,并添加足够的增殖介质来覆盖细胞。播种两天后,用增殖介质刷新细胞。
在显微镜下定期检查细胞,每隔一天刷新一次。当细胞达到90%汇合时,通过改变介质到分化介质来诱导分化。要收集细胞以进行进一步的RNA分析,用DPBS清洗细胞两次,然后加入解解缓冲液。
在分化日零、二、四和七收集细胞。RNA分离后,双链cDNA将被转换,RNA-seq库将为下一代测序做好准备。测序后,序列读取将被下载并映射到人类基因组。
下载并安装 R 包后,从 readspergene.out 生成帐户表。选项卡文件并编写包含所有文件名、区分日和其他相关示例数据的示例数据文件。有关示例,请参阅补充编码文件。
然后使用计数表和示例数据生成包含可计数和示例数据的 deseq2 对象。对于基因表达规范化,使用 deseq2RLD 或 VST 规范化 deseq2 对象中的计数表。虽然 RLD 规范化是首选,但 VST 规范化要快得多。
使用 R 中的 dist 函数根据规范化的读取计数强度绘制样本距离,然后根据样本距离执行 hclust 聚类。接下来,使用 pheatmap 函数绘制热图。最后,使用 deeq2 的绘图 PCA 函数生成规范化读取计数强度的原理分量分析或 PCA 图。
PCA 是探索性数据分析的工具,可用于可视化不同样本之间的距离和连接。使用 rowVars 函数执行高度可变的基因表达分析,该函数通过按不同时间点样本之间的方差顺序提取前 500 个高度可变基因。这些基因在分化日中其标准化强度的标准偏差最高。
对高度可变的基因执行 k-means 聚类,通过不同的表达式模式对它们进行聚类。使用图图包在热图中可视化基因。热图中绘制的强度是除去 2 规范化强度,减去中值。
生成一个表达背景基因的列表,包括单个样本中计数超过 10 个的所有基因,并列出每个组的基因。最后,使用GOrilla执行基因本体分析。使用背景基因列表作为背景集,将集群中高度可变基因列表用作目标集,然后单击搜索丰富的 GO 术语。
或者,更高级的 R 用户可以使用包群集Profiler自动执行 GO 术语扩充分析。在RNA-seq分析中,从5个个体中提取的角蛋白细胞线用于分化。主要成分分析表明,经过分化的角蛋白细胞具有连接但独特的整体基因表达特征。
高度可变的基因聚集在一起,以可视化分化过程中的基因表达动力学和模式。每个基因组都以角蛋白细胞分化特征基因表示,基因本体论注释显示出基因功能的显著差异。在第二个实验中,比较了来自健康对联的角蛋白细胞和来自携带P63突变的患者的细胞系之间的细胞形态和基因表达差异。
主要成分分析表明,控制细胞系明显遵循分化模式,但分化过程中突变细胞的基因表达模式与增殖或未分化细胞的基因表达模式基本相似。在聚类分析中,聚类一中的基因在控制细胞中受到降低控制,在携带R204W和R279H突变的患者细胞中部分降低调节,但在携带R304W的细胞中保持高。如基因本体分析所示,这些基因可能在细胞增殖中发挥作用。
两个基因集群首先被引入,随后在控制细胞中降低调节。这些基因很可能参与角蛋白细胞分化,因为表皮分化和角蛋白化功能在这个集群中具有高度丰富性。第三组的基因仅在控制细胞分化结束时诱导,这表明它们可能在表皮的最外层发挥作用。
在分析RNA-seq数据时,事先了解预期结果非常重要。这将帮助你解释质量控制和 PCA 图,并评估您的结果是否有意义。我们的方法可用于研究表皮生物学和其他生物系统中的基因转录。