首先,使用 Python 版本 3.7 创建名为“运行状况模型”的新虚拟环境。在 Slurm 集群超级计算平台中,执行模块 Load Anaconda Command。执行命令后,屏幕上会出现确认提示。
输入 Y 继续,然后等待该过程完成。然后按照特定于平台的说明激活虚拟环境。接下来,运行命令以安装 PyTorch 1.13.1。
按照安装指南安装割炬几何形状的其他软件包,例如 torch_scatter、torch_sparse、torch_cluster 和 torch_spline_convulsion。然后安装割炬几何包版本 2.2.0。从健康信息学实验室网站下载代码和预训练的运行状况模型。
将文件解压缩到所需的路径。然后,将命令行中的工作目录更改为运行状况模型 mqTrans 文件夹。执行命令生成 mqTrans 特征并获取输出。
mqTrans 特征将作为输出 MQ 目标 CSV 生成,标签文件将重新保存为输出标签 CSV。此外,mRNA 基因的原始表达值将被提取为文件输出测试靶标 CSV。接下来,使用特征选择算法来选择 mqTrans 特征。
如果选择 mqTrans 特征或原始特征而不组合它们,请将合并设置为 false。选择 800 个原始特征,并将数据集拆分为 0.8 到 0.2 进行训练和测试。要将 mqTrans 特征与用于特征选择的原始表达式值相结合,请将 combine 设置为 true。
鉴定出具有不同 mqTrans 值但未分化 mRNA 表达的深色生物标志物。在 3062 个特征中,检测到 221 个暗生物标志物。与大多数癌症类型的传统生物标志物相比,观察到暗生物标志物的普遍稀缺性,但 BRCA、MESO 和 TGCT 除外。