JoVE Logo
Faculty Resource Center

Sign In

Abstract

Biochemistry

Une approche par graphe de connaissances pour élucider le rôle des voies organellaires dans la maladie via des rapports biomédicaux

Published: October 13th, 2023

DOI:

10.3791/65084

1Department of Physiology, UCLA School of Medicine, 2Scalable Analytics Institute (ScAi) at Department of Computer Science, UCLA School of Engineering, 3NIH BRIDGE2AI Center at UCLA & NHLBI Integrated Cardiovascular Data Science Training Program, UCLA, 4Medical Informatics, University of California at Los Angeles (UCLA), 5Department of Medicine (Cardiology), UCLA School of Medicine

L’augmentation rapide et les grandes quantités de rapports biomédicaux, chacun contenant de nombreuses entités et des informations riches, représentent une ressource précieuse pour les applications d’exploration de textes biomédicaux. Ces outils permettent aux chercheurs d’intégrer, de conceptualiser et de traduire ces découvertes afin de découvrir de nouvelles perspectives sur la pathologie et la thérapeutique des maladies. Dans ce protocole, nous présentons CaseOLAP LIFT, un nouveau pipeline de calcul permettant d’étudier les composants cellulaires et leurs associations de maladies en extrayant des informations sélectionnées par l’utilisateur à partir d’ensembles de données textuelles (par exemple, la littérature biomédicale). Le logiciel identifie les protéines subcellulaires et leurs partenaires fonctionnels dans des documents pertinents pour la maladie. D’autres documents relatifs à la maladie sont identifiés à l’aide de la méthode d’imputation par étiquette du logiciel. Afin de contextualiser les associations protéine-maladie qui en résultent et d’intégrer des informations provenant de multiples ressources biomédicales pertinentes, un graphe de connaissances est automatiquement construit pour des analyses ultérieures. Nous présentons un cas d’utilisation avec un corpus de ~34 millions de documents texte téléchargés en ligne pour fournir un exemple d’élucidation du rôle des protéines mitochondriales dans les phénotypes distincts des maladies cardiovasculaires à l’aide de cette méthode. De plus, un modèle d’apprentissage profond a été appliqué au graphe de connaissances résultant pour prédire les relations non signalées auparavant entre les protéines et la maladie, ce qui a donné lieu à 1 583 associations avec des probabilités prédites >0,90 et avec une aire sous la courbe caractéristique de fonctionnement du récepteur (AUROC) de 0,91 sur l’ensemble de test. Ce logiciel dispose d’un flux de travail hautement personnalisable et automatisé, avec un large éventail de données brutes disponibles pour l’analyse ; Par conséquent, à l’aide de cette méthode, les associations protéine-maladie peuvent être identifiées avec une fiabilité accrue au sein d’un corpus textuel.

Explore More Videos

Biochimie

This article has been published

Video Coming Soon

JoVE Logo

Privacy

Terms of Use

Policies

Research

Education

ABOUT JoVE

Copyright © 2024 MyJoVE Corporation. All rights reserved