此措施有助于回答生物医学检测领域有关生成多个解决方案的关键问题。该技术的主要优点是,它提供了一个用户友好的图形用户界面,以帮助生物医学研究人员检测多个功能沉降。首先将数据矩阵和类标签加载到软件中。
单击加载数据矩阵以选择用户指定的数据指标文件,并加载类标签以选择相应的类标签文件。若要确定排名靠前的要素数中的类标签,请在相应的下拉框中选择正类和负类的名称,并在前 X 下拉框中选择 10 作为顶级要素的数量,以用于功能子集的综合屏幕。要调整不同性能的系统参数,请选择性能测量精度作为所选极端学习机器分类器的精度平衡精度下拉框。
然后,在性能截止输入框中为指定的性能测量选择 0.7 的截止值。要运行管道,请单击"分析"并选择 0.7 作为性能测量截止的默认值。并且,10 作为最佳要素子集的默认编号。
然后收集和解释软件检测到的功能。若要生成具有软件检测到的最佳分类性能的子集前 10 个要素的 3D 散点图,请单击使用 F1、F2 和 F3 轴三个要素的排名,按其等级的升序对要素子集中的三个要素进行排序。将性能截止值更改为 0.7,然后单击"分析"以生成要素子集的 3D 散点图,其大于或等于性能截止性能测量值。
然后单击 3D 调谐以打开一个新窗口,手动调整 3D 散点图的视角,并减少可减少检测到要素子集的冗余。要注释DNA和蛋白质序列水平中的基因,请打开David数据库网页,然后单击基因ID转换链接,输入准备好数据集的第一个生物标志子集的特征ID。单击基因列表链接并单击提交列表以检索感兴趣的注释,并显示基因列表以获取基因符号列表。
接下来,打开 GeneCards 数据库网页,在数据库查询输入框中输入感兴趣的基因名称,以查找该基因的注释。打开人类数据库中的在线孟德利亚遗传,并搜索该基因,从数据库中查找该基因的注释。要注释编码的蛋白质,请打开 UniProt 知识库数据库页面,并搜索该数据库中的基因注释。
打开基于组的预测系统(GPS Web 服务器)并从 UniProt 知识库数据库中检索生物标志物基因编码的蛋白质序列,并使用在线 GPS 工具预测蛋白质过渡后修饰残留物。要注释蛋白质-蛋白质相互作用和丰富的功能模块,请打开字符串 Web 服务器页面,并使用字符串数据库搜索感兴趣的基因以查找其精心策划的属性。要导出检测到的生物标记子集以进行进一步分析,请单击导出表并选择用于保存文件的适当文本格式。
然后,将可视化绘图导出为单独的图像文件,单击每个绘图下的保存并选择适当的图像格式以保存每个文件。在此代表性实验中,两个数据集被格式化为 CSV 文件,并加载到软件中,如演示。在第一个数据集中,128个样本(具有 12,625 个特征和单个类标签)加载了包含 95 个阴值样本和 33 个阳性样本的最终数据矩阵。
还对第二套困难的数据集也进行了类似的操作。在要素名称中搜索特定于用户的关键字可显示每个数据集的要素直方图。对每个数据集执行管道算法后,检测出 120 个合格的生物标志子集,以便于区分数据集,其中 57 个三元生物标志子集表现出 100% 的准确性。
但是,只有 76 个生物标志子集检测到困难的数据集。而且,生物标志物子集精度较低,表明生物标志物是表型特异性的,这是生物标志物检测的另一个重大挑战。在使用此过程时,必须记住,未来的选择问题具有多个解决方案。
阅读 SIM 卡的最佳性能。该技术开发后,为生物医学研究人员探索生物医学检测和多种解决方案铺平了道路。