JoVE Logo
Faculty Resource Center

Sign In

Abstract

Biochemistry

생물의학 보고서를 통해 질병에서 세포 소기관 경로의 역할을 밝히기 위한 지식 그래프 접근 방식

Published: October 13th, 2023

DOI:

10.3791/65084

1Department of Physiology, UCLA School of Medicine, 2Scalable Analytics Institute (ScAi) at Department of Computer Science, UCLA School of Engineering, 3NIH BRIDGE2AI Center at UCLA & NHLBI Integrated Cardiovascular Data Science Training Program, UCLA, 4Medical Informatics, University of California at Los Angeles (UCLA), 5Department of Medicine (Cardiology), UCLA School of Medicine

빠르게 증가하는 방대한 양의 생물 의학 보고서는 각각 수많은 엔티티와 풍부한 정보를 포함하고 있으며 생물 의학 텍스트 마이닝 응용 프로그램을위한 풍부한 리소스를 나타냅니다. 이러한 도구를 통해 연구자는 이러한 발견을 통합, 개념화 및 번역하여 질병 병리학 및 치료법에 대한 새로운 통찰력을 발견할 수 있습니다. 이 프로토콜에서는 텍스트 데이터 세트(예: 생물 의학 문헌)에서 사용자가 선택한 정보를 추출하여 세포 구성 요소와 질병 연관성을 조사하는 새로운 계산 파이프라인인 CaseOLAP LIFT를 제시합니다. 이 소프트웨어는 질병 관련 문서 내에서 세포 내 단백질과 그 기능적 파트너를 식별합니다. 추가 질병 관련 문서는 소프트웨어의 라벨 대체 방법을 통해 식별됩니다. 결과적인 단백질-질병 연관성을 맥락화하고 여러 관련 생물 의학 리소스의 정보를 통합하기 위해 추가 분석을 위해 지식 그래프가 자동으로 구성됩니다. 우리는 이 방법을 사용하여 뚜렷한 심혈관 질환 표현형에서 미토콘드리아 단백질의 역할을 설명하는 예를 제공하기 위해 온라인으로 다운로드한 ~3,400만 개의 텍스트 문서 말뭉치와 함께 한 가지 사용 사례를 제시합니다. 또한 딥 러닝 모델을 결과 지식 그래프에 적용하여 이전에 보고되지 않은 단백질과 질병 간의 관계를 예측하여 예측 확률>0.90 및 AUROC(AUROC) 아래 면적이 테스트 세트에서 0.91인 1,583개의 연관성을 얻었습니다. 이 소프트웨어는 분석에 사용할 수 있는 광범위한 원시 데이터와 함께 고도로 사용자 정의 가능하고 자동화된 워크플로를 제공합니다. 따라서 이 방법을 사용하면 텍스트 말뭉치 내에서 향상된 신뢰성으로 단백질-질병 연관성을 식별할 수 있습니다.

Explore More Videos

200

This article has been published

Video Coming Soon

JoVE Logo

Privacy

Terms of Use

Policies

Research

Education

ABOUT JoVE

Copyright © 2024 MyJoVE Corporation. All rights reserved