为了建立初始 PSC 集落状态的机器学习或 ML 策略,请在零小时或 CHIR 处理之前准备明场图像数据集和最终的 cTNT 荧光图像。通过从其 cTNT 荧光图像计算的分化效率指数来量化每个孔的分化效率。通过揭示菌落形状特性的高维特征来量化零小时明场图像的形态特征。
将数据集随机划分为训练集和测试集。在训练集上训练随机森林回归模型,以预测零小时明场图像特征的区分效率。在测试集上评估经过训练的随机森林模型。
准备一个数据集,其中包含 0 到 12 小时的整个井明场图像流和相应的 CHIR 剂量,它们是 CHIR 浓度和持续时间的组合。根据显示的标准,确定每批每个 CHIR 持续时间下的低、最佳和高 CHIR 浓度范围。在每个持续时间下,计算每个浓度的 delta CHIR 浓度,以量化其与最佳浓度的偏差。
提取数据集中图像流的特征。对于每个 CHIR 持续时间,训练一个逻辑回归模型,以根据训练集上的图像流特征预测 CHIR 浓度标签。使用准确度、精度、召回率、F1 分数和曲线下面积评估经过训练的 Logistic 回归模型在测试集上的分类性能。
为了评估模型在 CHIR 剂量评估中的性能,在测试集中,使用从负一到一的偏差分数合并具有相同 CHIR 浓度的平行孔的预测标签。使用 Pearson 相关系数,确认预测的偏差分数与每个剂量的真实 delta CHIR 浓度高度相关。接下来,应用经过训练的 logistic 回归模型来评估新批次中的 CHIR 剂量。
通过基于模型的 CHIR 剂量评估,通过在 48 小时之前将其 CHIR 持续时间或浓度调整为最佳浓度,相应地在每个次优 CHIR 浓度下抢救井。在第 6 天准备一个由明场图像组成的数据集,并通过跟踪从第 12 天到第 6 天的图像流中的 cTNT 阳性细胞来手动注释 CM 提交的 CPC。将 CM 提交的 CPC 的明场图像和相应的手动注释裁剪为补丁。
将大于或等于 30% 的 CM 承诺 CPC 的补丁标记为正,将没有 CM 承诺 CPC 的补丁标记为负。训练深度卷积神经网络 ResNeSt 以学习对这些补丁进行分类。使用 Grad-CAM 突出显示对热图表示的 ResNeSt 推理贡献最大的区域。
合并补丁级别二值化热图以获取预测的 CM 提交的 CPC 区域,这些区域被命名为成像识别的 CPC 或 IRCPC 区域。使用准确率、F1 分数、精度、召回率、特异性和交集比并集将 IRCPC 区域与测试集上的手动注释掩码进行比较。准备一个由 CMs 的明场图像和相应的 cTNT 荧光图像组成的数据集。
在将训练后的模型应用于测试集之前,先在训练集上训练 pix2pix 模型。为了纯化 CM 定型的 CPC,使用非细胞毒性光激活探针、双激活细胞追踪器 1 或 DACT-1 对非 CPC 进行区域选择性标记。用 405 纳米激光线照射非 CPC 区域后,使用 561 纳米激光线检测 DACT-1 标记的细胞。
对解离的细胞进行分选后,将分选的细胞接种在基质胶包被的 96 孔板中,并在培养基中培养 DACT-1 标记的非 CPC、未标记的 IRCPC 和对照组细胞 6 天。