JoVE Logo
Faculty Resource Center

Sign In

Abstract

Biochemistry

Метод графа знаний для выяснения роли органеллярных путей в заболевании с помощью биомедицинских отчетов

Published: October 13th, 2023

DOI:

10.3791/65084

1Department of Physiology, UCLA School of Medicine, 2Scalable Analytics Institute (ScAi) at Department of Computer Science, UCLA School of Engineering, 3NIH BRIDGE2AI Center at UCLA & NHLBI Integrated Cardiovascular Data Science Training Program, UCLA, 4Medical Informatics, University of California at Los Angeles (UCLA), 5Department of Medicine (Cardiology), UCLA School of Medicine

Быстро растущее и огромное количество биомедицинских отчетов, каждый из которых содержит множество сущностей и богатую информацию, представляет собой богатый ресурс для биомедицинских текстовых приложений. Эти инструменты позволяют исследователям интегрировать, концептуализировать и транслировать эти открытия, чтобы получить новые знания о патологии заболеваний и терапии. В этом протоколе мы представляем CaseOLAP LIFT, новый вычислительный конвейер для исследования клеточных компонентов и их ассоциаций с заболеваниями путем извлечения отобранной пользователем информации из текстовых наборов данных (например, биомедицинской литературы). Программное обеспечение идентифицирует субклеточные белки и их функциональных партнеров в документах, относящихся к заболеванию. Дополнительные документы, относящиеся к заболеванию, идентифицируются с помощью метода вменения этикеток, разработанного программным обеспечением. Для контекстуализации результирующих ассоциаций между белками и заболеваниями и интеграции информации из нескольких релевантных биомедицинских ресурсов автоматически создается граф знаний для дальнейшего анализа. Мы представляем один из вариантов использования с корпусом из ~34 миллионов текстовых документов, загруженных в Интернет, чтобы предоставить пример выяснения роли митохондриальных белков в различных фенотипах сердечно-сосудистых заболеваний с помощью этого метода. Кроме того, модель глубокого обучения была применена к полученному графу знаний для прогнозирования ранее неизвестных взаимосвязей между белками и заболеваниями, в результате чего было получено 1583 ассоциации с прогнозируемыми вероятностями >0,90 и с областью под кривой рабочих характеристик приемника (AUROC), равной 0,91 на тестовом наборе. Это программное обеспечение отличается настраиваемым и автоматизированным рабочим процессом с широким спектром необработанных данных, доступных для анализа; Таким образом, с помощью этого метода можно с повышенной надежностью идентифицировать ассоциации белков и заболеваний в пределах текстового корпуса.

Explore More Videos

200

This article has been published

Video Coming Soon

JoVE Logo

Privacy

Terms of Use

Policies

Research

Education

ABOUT JoVE

Copyright © 2024 MyJoVE Corporation. All rights reserved