JoVE Logo
Faculty Resource Center

Sign In

Abstract

Biochemistry

Een kennisgrafiekbenadering om de rol van organellaire routes bij ziekten op te helderen via biomedische rapporten

Published: October 13th, 2023

DOI:

10.3791/65084

1Department of Physiology, UCLA School of Medicine, 2Scalable Analytics Institute (ScAi) at Department of Computer Science, UCLA School of Engineering, 3NIH BRIDGE2AI Center at UCLA & NHLBI Integrated Cardiovascular Data Science Training Program, UCLA, 4Medical Informatics, University of California at Los Angeles (UCLA), 5Department of Medicine (Cardiology), UCLA School of Medicine

De snel toenemende en enorme hoeveelheden biomedische rapporten, die elk tal van entiteiten en rijke informatie bevatten, vormen een rijke bron voor biomedische textminingtoepassingen. Deze tools stellen onderzoekers in staat om deze ontdekkingen te integreren, te conceptualiseren en te vertalen om nieuwe inzichten in ziektepathologie en therapeutica te ontdekken. In dit protocol presenteren we CaseOLAP LIFT, een nieuwe computationele pijplijn om cellulaire componenten en hun ziekteassociaties te onderzoeken door door de gebruiker geselecteerde informatie uit tekstdatasets (bijv. Biomedische literatuur) te extraheren. De software identificeert subcellulaire eiwitten en hun functionele partners in ziekterelevante documenten. Aanvullende ziekterelevante documenten worden geïdentificeerd via de label-imputatiemethode van de software. Om de resulterende eiwit-ziekteassociaties te contextualiseren en informatie uit meerdere relevante biomedische bronnen te integreren, wordt automatisch een kennisgrafiek geconstrueerd voor verdere analyses. We presenteren een use case met een corpus van ~ 34 miljoen tekstdocumenten die online zijn gedownload om een voorbeeld te geven van het ophelderen van de rol van mitochondriale eiwitten in verschillende fenotypes van hart- en vaatziekten met behulp van deze methode. Bovendien werd een deep learning-model toegepast op de resulterende kennisgrafiek om eerder niet-gerapporteerde relaties tussen eiwitten en ziekte te voorspellen, wat resulteerde in 1.583 associaties met voorspelde waarschijnlijkheden >0,90 en met een gebied onder de receiver operating characteristic curve (AUROC) van 0,91 op de testset. Deze software beschikt over een zeer aanpasbare en geautomatiseerde workflow, met een breed scala aan onbewerkte gegevens die beschikbaar zijn voor analyse; Daarom kunnen met behulp van deze methode eiwit-ziekteassociaties worden geïdentificeerd met verhoogde betrouwbaarheid binnen een tekstcorpus.

Explore More Videos

Biochemie

This article has been published

Video Coming Soon

JoVE Logo

Privacy

Terms of Use

Policies

Research

Education

ABOUT JoVE

Copyright © 2024 MyJoVE Corporation. All rights reserved