CorExplorer 发现肿瘤相关基因表达因子的方式是数学原则使用交互式可视化,以及临床和数据库信息的生物发现。CorEx 执行信息最大化的方式需要相对较少的样本来查找高维数据中的群集。它产生的潜在因素的层次有助于生物理解。
这种方法在癌症生物学中应用起来已经被证明是有趣的。其信息理论基础使其适用于任何具有许多变量且对它们的关系了解很少的系统。首先导航到 CorExplorer 主页。
在"快速链接"下,单击加号展开按钮,查看有关感兴趣的癌症数据训练的 CorEx 因子图的摘要。例如,此处显示了 TCGA 卵巢癌数据的因子图。检查因子图后,单击肺 TCGA-LUAD 以访问用于肺癌 RNA 测序的 CorExplorer 页面,并使用 CorExplorer 因子图窗口浏览感兴趣的基因的 CorEx 因子图。
在因子图显示窗口上移动鼠标光标时,使用鼠标触控板放大因子图以查看图形的详细信息,例如每个因子中最重要的基因以及不同层中的节点之间的连接。要找到目标基因,请单击"基因"菜单并键入基因名称以在下拉列表中选择它。按键盘上的 Return 可使视图缩放至感兴趣的基因最密切相关的因子。
将鼠标重新定位在图形显示屏上,然后滚动缩小以查看节点的级别及其相关因素,这些因素是关系最密切的基因因子的邻域。请注意,仅显示重量大于最小链接权重滑块上指示的阈值的基因。要查看与因子相关的所有基因,请单击相应的节点,并在弹出窗口中选择"加载其他基因"。
出现"完成"时,关闭弹出窗口。在标题部分中,单击并拖动最小链接权重修改器到 0.05,以允许基因按重量顺序显示。要标识与生物函数的关联,在"注释"窗口中取消选中错误发现率排序,以按因子数而不是错误发现率对因子下拉菜单进行排序。
滚动并单击以选择"注释"窗口下拉菜单中感兴趣的因子,以显示该因子的扩充注释。然后单击富集因子,立即查看图形显示屏上以黄色突出显示的关联基因。请注意,消失或显示为不同 GO 术语的因子会根据是否为具有所选注释的基因进行丰富选择。
对于感兴趣的过滤因子,使用生存和聚类质量,从数据集下拉菜单选择 TCGA_OVCA 转到 CorExplorer 页面进行 TCGA 卵巢癌 RNA 测序。注意从生存窗口具有最大生存差异的因子,并在因子图窗口中从因子下拉菜单中选择此因子。单击并拖动"链接权重"滑块到 0.5,并记下因子中的基因数。
展开"生存"窗口中的因素列表,然后单击生存窗口下拉列表中的下一个最佳因子以查看其相关的生存曲线。将显示重要的 GO 和 Kegg 注释。为了更好地了解基因在此因子中的生物学作用,请选择因子图窗口顶部的因子图层,并在窗口上移动鼠标,同时缩小以显示整个聚类和相关因子。
要了解与群集节点关联的因子的相对重要性,请取消选中"生存"窗口中按 p-val 排序,然后单击每个因子编号连续查看它们,注意显示生存关联的因子。在"添加窗口"菜单中选择 PPI,然后单击"添加"以将 PPI 图表窗口添加到显示区域。在 PPI 图表窗口中,选择感兴趣的因子层来显示显著的蛋白质-蛋白质相互作用。
单击 StringDB 链接中的"视图"以连接到 STRINGdb 在线数据库,然后单击"继续"。然后打开 Anaylsis 选项卡,获取 PPI 网络基因的在线 GO 分析。将显示顶部蜂窝组件。
返回到"探索者"选项卡和 PPI 窗口并选择其他因子。再次单击 StringDB 链接中的"视图"。将显示不同的顶部蜂窝组件。
然后,在 PPI 窗口中,为 STRING 数据库分析选择另一个因素。要查找不同肿瘤类型的基因表达变异的共性和差异,请单击 CorExplorer 标题返回头版,然后单击"搜索"以访问允许搜索 CorExplorer 站点上所有数据集的页面。在"基因搜索"框中输入感兴趣的基因名称,然后单击"搜索"。
例如,如所示,FLT1 的权重相对较高,且有多个不同因素。在肺癌数据集中搜索BRCA1基因后,发现该基因与CorEx因子26的关系最强。此因子的 GO 术语富集非常高,DNA 修复的误发现率只有负 19 的 10 倍。
该选择还提请注意第二级分组L2_8具有六个密切相关的因素作为儿童。DNA修复蛋白-蛋白质相互作用网络紧密连接,进一步支持了因子26中基因紧密链接的功能。相关的生存图表明,与患者生存可能关联,必须确认在更大的数据集中。
从存活率评估开始,可以解剖与改善存活率相关的因素,如与特定基因表达组相关。为每种因素添加蛋白质-蛋白质相互作用窗口,有助于确定它们与生存关联的可能性解释。重要的是要检查每个因子的热图,以确认基因表达模式具有足够的质量来支持生物解释。
显示基因表达模式强烈、清晰的变异的热图可能表现出因子基因的协同表达,从高到低,或更复杂的模式,有些基因的低表达与其他基因的高表达相关。此过程的首要目标是通过将样本肿瘤映射到 CorExplorer 因子来确定潜在的肿瘤特异性疗法来设置个性化疗法。