JoVE Logo
Faculty Resource Center

Sign In

Abstract

Biochemistry

生物医学的報告 による 疾患におけるオルガネラ経路の役割を解明するためのナレッジグラフアプローチ

Published: October 13th, 2023

DOI:

10.3791/65084

1Department of Physiology, UCLA School of Medicine, 2Scalable Analytics Institute (ScAi) at Department of Computer Science, UCLA School of Engineering, 3NIH BRIDGE2AI Center at UCLA & NHLBI Integrated Cardiovascular Data Science Training Program, UCLA, 4Medical Informatics, University of California at Los Angeles (UCLA), 5Department of Medicine (Cardiology), UCLA School of Medicine

急速に増加し、膨大な量の生物医学レポートは、それぞれが多数のエンティティと豊富な情報を含み、生物医学テキストマイニングアプリケーションのための豊富なリソースを表しています。これらのツールにより、研究者はこれらの発見を統合、概念化、および翻訳して、疾患の病理学と治療法に関する新しい洞察を明らかにすることができます。このプロトコルでは、テキストデータセット(生物医学文献など)からユーザーが選択した情報を抽出することにより、細胞成分とその疾患関連を調査するための新しい計算パイプラインであるCaseOLAP LIFTを紹介します。このソフトウェアは、疾患関連文書内で細胞内タンパク質とその機能的パートナーを識別します。追加の疾患関連文書は、ソフトウェアのラベル補完方法 によって 識別されます。結果として生じるタンパク質と疾患の関連性をコンテキスト化し、複数の関連する生物医学リソースからの情報を統合するために、さらなる分析のために知識グラフが自動的に構築されます。オンラインでダウンロードされた~3,400万のテキスト文書のコーパスを使用した1つのユースケースを提示し、この方法を使用して、異なる心血管疾患の表現型におけるミトコンドリアタンパク質の役割を解明する例を示します。さらに、得られた知識グラフに深層学習モデルを適用して、これまで報告されていないタンパク質と疾患の関係を予測し、テストセットで予測確率>0.90、レシーバー動作特性曲線下面積(AUROC)0.91との関連が1,583件ありました。このソフトウェアは、高度にカスタマイズ可能で自動化されたワークフローを備えており、幅広い生データを分析に利用できます。したがって、この方法を使用すると、テキストコーパス内で信頼性の高いタンパク質と疾患の関連を識別できます。

Explore More Videos

200

This article has been published

Video Coming Soon

JoVE Logo

Privacy

Terms of Use

Policies

Research

Education

ABOUT JoVE

Copyright © 2024 MyJoVE Corporation. All rights reserved