阿尔茨海默病被认为在症状出现前几十年就开始了。最近的研究表明,肥胖和高血压等表型特征,以及教育水平和社会参与水平都可以作为危险因素。我们的目标是能够破译它们的贡献以及它们与疾病分子驱动因素的关系,以学习如何以个性化的方式进行早期干预。
多组学数据分析可用于整合蛋白质组学、转录组学、代谢组学和表型性状等多层生物数据,以全面了解疾病状态。自动编码器模型使用深度学习来降低多组学数据集的维数,从而有效地汇总关键信息,但是,要解释原始数据中单个特征相对于汇总输出的重要性具有挑战性。在深组学 AE 中,我们内置了一种算法,该算法推导出单个多组学特征相对于学习降维表示的重要性。
通过这种方法,我们可以识别分子相似的模块及其与患者表型特征的关联。深层组学 AE 有助于将患者的表型特征与疾病的分子组成联系起来。例如,你可以用它来问,在老年患者中,与阿尔茨海默病最相关的分子通路是什么,在年轻患者中与阿尔茨海默病最相关的分子通路是什么?
与受教育程度较高的患者相比,受教育程度较低的患者患上这种疾病与哪些因素有关?