JoVE Logo
Faculty Resource Center

Sign In

Abstract

Biochemistry

通过生物医学报告 阐明 细胞器通路在疾病中的作用的知识图谱方法

Published: October 13th, 2023

DOI:

10.3791/65084

1Department of Physiology, UCLA School of Medicine, 2Scalable Analytics Institute (ScAi) at Department of Computer Science, UCLA School of Engineering, 3NIH BRIDGE2AI Center at UCLA & NHLBI Integrated Cardiovascular Data Science Training Program, UCLA, 4Medical Informatics, University of California at Los Angeles (UCLA), 5Department of Medicine (Cardiology), UCLA School of Medicine

迅速增长和大量的生物医学报告,每份报告都包含众多实体和丰富的信息,为生物医学文本挖掘应用提供了丰富的资源。这些工具使研究人员能够整合、概念化和转化这些发现,以发现对疾病病理学和治疗方法的新见解。在该协议中,我们提出了CaseOLAP LIFT,这是一种新的计算管道,通过从文本数据集(例如,生物医学文献)中提取用户选择的信息来研究细胞成分及其疾病关联。该软件在疾病相关文档中识别亚细胞蛋白及其功能伴侣。通过软件的标签插补方法 识别 其他与疾病相关的文档。为了将由此产生的蛋白质 - 疾病关联置于上下文中并整合来自多个相关生物医学资源的信息,自动构建知识图谱以进行进一步分析。我们提出了一个用例,其中包含~3400万在线下载的文本文档,以提供使用该方法阐明线粒体蛋白在不同心血管疾病表型中的作用的示例。此外,将深度学习模型应用于生成的知识图谱,以预测以前未报告蛋白质与疾病之间的关系,从而产生了1,583个关联,预测概率>0.90,测试集上的受试者工作特征曲线下面积(AUROC)为0.91。该软件具有高度可定制和自动化的工作流程,具有广泛的原始数据可用于分析;因此,使用这种方法,可以在文本语料库中以增强的可靠性识别蛋白质 - 疾病关联。

Explore More Videos

200

This article has been published

Video Coming Soon

JoVE Logo

Privacy

Terms of Use

Policies

Research

Education

ABOUT JoVE

Copyright © 2024 MyJoVE Corporation. All rights reserved