首先,下载阿尔茨海默氏症数据文件以进行样本合并,并配置数据路径和样本名称。导入下载的样本,并在函数名称下为它们分配特定于性别的名称。使用函数 list 和 Read10x,以批处理方式为所有样本生成 Seurat 对象,并将最小单元格参数指定为 3,最小特征参数为 200。
使用 RenameCells 函数,将样本 ID 作为前缀添加到单元条形码中,以便在合并过程中保留它们。为了进行质量控制,使用 PercentageFeatureSet 函数计算每个细胞的线粒体红细胞和核糖体基因比率。使用双方括号运算符将这些计算出的比率存储在元数据中,以将此信息直接附加到每个单元格的元数据。
利用子集功能,使用 RNA、线粒体、核糖体和红细胞的适当参数进行细胞过滤。使用 NormalizeData 函数对数据进行规范化。使用 FindVariableFeatures,确定数据集中排名前 2000 的变量特征。
使用 RunPCA 对数据进行主成分分析,保留 50 个主成分。使用 ElbowPlot 函数,生成肘部图以确定后续分析的最佳维数。考虑到前 50 个维度,选择比例数据以使所有要素处于可比的比例上。
利用FindNeighbors函数,根据30个维度识别最近邻,并运行UMAP算法,将数据的维数降低到30个维度。选择 DimPlot 函数以可视化组中将减少参数设置为 UMAP 的已处理数据。通过设置为原始标识的参数。
利用SCTransform函数,对数据进行归一化和标准化,并应用和谐算法对剩余的单核数据进行积分。选择要整合的 SCT 检测,并将最大和谐迭代次数设置为 20。然后运行 FindClusters 函数并将分辨率参数设置为 0.07 以识别数据中的不同聚类,同时使用 RunUMAP 函数进一步降低数据的维数并在较低维空间中可视化聚类。
对于细胞类型注释,识别细胞簇异质性,并使用明确表达的标记基因对每个簇细胞的类型进行分类。使用 ggplot2 包通过 UMAP 可视化呈现各种细胞类型,其中各种细胞类型以不同的颜色代码突出显示。最后,计算每种细胞类型的比例,按性别分层。
使用这种方法,在 17 名男性和 17 名女性阿尔茨海默病患者的数据中确定了按性别划分的每种细胞类型的比例。将每种神经胶质细胞类型的已知细胞类型标记物的平均表达投射到UMAP图上,以识别细胞群。