JoVE Logo
Faculty Resource Center

Sign In

Abstract

Biochemistry

Un approccio basato su Knowledge Graph per chiarire il ruolo delle vie organellari nella malattia attraverso referti biomedici

Published: October 13th, 2023

DOI:

10.3791/65084

1Department of Physiology, UCLA School of Medicine, 2Scalable Analytics Institute (ScAi) at Department of Computer Science, UCLA School of Engineering, 3NIH BRIDGE2AI Center at UCLA & NHLBI Integrated Cardiovascular Data Science Training Program, UCLA, 4Medical Informatics, University of California at Los Angeles (UCLA), 5Department of Medicine (Cardiology), UCLA School of Medicine

Le grandi quantità di referti biomedici, in rapido aumento, ciascuno contenente numerose entità e ricche informazioni, rappresentano una ricca risorsa per le applicazioni di text-mining biomedico. Questi strumenti consentono ai ricercatori di integrare, concettualizzare e tradurre queste scoperte per scoprire nuove intuizioni sulla patologia e sulle terapie della malattia. In questo protocollo, presentiamo CaseOLAP LIFT, una nuova pipeline computazionale per studiare i componenti cellulari e le loro associazioni di malattie estraendo informazioni selezionate dall'utente da set di dati testuali (ad esempio, letteratura biomedica). Il software identifica le proteine subcellulari e i loro partner funzionali all'interno di documenti rilevanti per la malattia. Ulteriori documenti rilevanti per la malattia vengono identificati tramite il metodo di imputazione delle etichette del software. Per contestualizzare le associazioni proteina-malattia risultanti e per integrare le informazioni provenienti da più risorse biomediche rilevanti, viene costruito automaticamente un grafo di conoscenza per ulteriori analisi. Presentiamo un caso d'uso con un corpus di ~ 34 milioni di documenti di testo scaricati online per fornire un esempio di chiarimento del ruolo delle proteine mitocondriali in fenotipi distinti di malattie cardiovascolari utilizzando questo metodo. Inoltre, un modello di deep learning è stato applicato al grafo della conoscenza risultante per prevedere le relazioni precedentemente non riportate tra proteine e malattia, risultando in 1.583 associazioni con probabilità previste >0,90 e con un'area sotto la curva caratteristica operativa del ricevitore (AUROC) di 0,91 sul set di test. Questo software presenta un flusso di lavoro altamente personalizzabile e automatizzato, con un'ampia gamma di dati grezzi disponibili per l'analisi; Pertanto, utilizzando questo metodo, le associazioni proteina-malattia possono essere identificate con maggiore affidabilità all'interno di un corpus di testo.

Explore More Videos

Biochimica

This article has been published

Video Coming Soon

JoVE Logo

Privacy

Terms of Use

Policies

Research

Education

ABOUT JoVE

Copyright © 2024 MyJoVE Corporation. All rights reserved