DeepOmicsAE: Representando Módulos de Sinalização na Doença de Alzheimer com Análise de Aprendizagem Profunda de Proteômica, Metabolômica e Dados Clínicos

Elena Panizza

doi:10.3791/65910

A subscription to JoVE is required to view this content. Sign in or start your free trial.

Summary

DeepOmicsAE é um fluxo de trabalho centrado na aplicação de um método de aprendizagem profunda (ou seja, um autoencoder) para reduzir a dimensionalidade de dados multi-ômicos, fornecendo uma base para modelos preditivos e módulos de sinalização que representam várias camadas de dados ômicos.

Abstract

Grandes conjuntos de dados ômicos estão se tornando cada vez mais disponíveis para pesquisas em saúde humana. Este artigo apresenta o DeepOmicsAE, um fluxo de trabalho otimizado para a análise de conjuntos de dados multi-ômicos, incluindo proteômica, metabolômica e dados clínicos. Esse fluxo de trabalho emprega um tipo de rede neural chamada autoencoder, para extrair um conjunto conciso de recursos dos dados de entrada multi-ômicos de alta dimensão. Além disso, o fluxo de trabalho fornece um método para otimizar os principais parâmetros necessários para implementar o autoencoder. Para mostrar esse fluxo de trabalho, dados clínicos foram analisados de uma coorte de 142 indivíduos saudáveis ou diagnosticados com doença de Alzheimer, juntamente com o proteoma e o metaboloma de suas amostras cerebrais post-mortem. As características extraídas da camada latente do autoencoder retêm a informação biológica que separa pacientes saudáveis e doentes. Além disso, as características individuais extraídas representam módulos de sinalização molecular distintos, cada um dos quais interage de forma única com as características clínicas dos indivíduos, fornecendo um meio para integrar os dados proteômicos, metabolômicos e clínicos.

Introduction

Uma proporção cada vez maior da população está envelhecendo e espera-se que a carga de doenças relacionadas à idade, como a neurodegeneração, aumente acentuadamente nas próximas décadas¹. A doença de Alzheimer é o tipo mais comum de doença neurodegenerativa². O progresso na busca de um tratamento tem sido lento, dada a nossa fraca compreensão dos mecanismos moleculares fundamentais que impulsionam o início e o progresso da doença. A maioria das informações sobre a doença de Alzheimer é obtida post-mortem a partir do exame do tecido cerebral, o que tornou a distinção entre causas e consequências uma tarefa difícil

Protocol

Observação : os dados usados aqui foram dados ROSMAP baixados do portal de conhecimento do AD. Não é necessário consentimento informado para baixar e reutilizar os dados. O protocolo aqui apresentado utiliza deep learning para analisar dados multi-ômicos e identificar módulos de sinalização que distinguem pacientes específicos ou grupos amostrais baseados, por exemplo, em seu diagnóstico. O protocolo também fornece um pequeno conjunto de recursos extraídos que resumem os dados originais em grande escala e po.......

Representative Results

Para mostrar o protocolo, analisamos um conjunto de dados que compreende o proteoma, metaboloma e informações clínicas derivadas de cérebros post-mortem de 142 indivíduos saudáveis ou diagnosticados com doença de Alzheimer.

Após a realização da seção 1 do protocolo para pré-processar os dados, o conjunto de dados incluiu 6.497 proteínas, 443 metabólitos e três características clínicas (sexo, idade ao morrer e educação). A característica alvo é o diagnóstico de co.......

Discussion

A estrutura do conjunto de dados é crítica para o sucesso do protocolo e deve ser cuidadosamente verificada. Os dados devem ser formatados conforme indicado na seção 1 do protocolo. A atribuição correta de posições de coluna também é fundamental para o sucesso do método. Os dados proteômicos e metabolômicos são pré-processados de forma diferente e a seleção de características é conduzida separadamente devido à natureza diferente dos dados. Portanto, é fundamental atribuir posições de coluna correta.......

Disclosures

O autor declara não haver conflitos de interesse.

Acknowledgements

Este trabalho foi apoiado pelo NIH grant CA201402 e pelo Cornell Center for Vertebrate Genomics (CVG) Distinguished Scholar Award. Os resultados aqui publicados são, no todo ou em parte, baseados em dados obtidos do Portal de Conhecimento do AD (https://adknowledgeportal.org). Os dados do estudo foram fornecidos através da Accelerating Medicine Partnership for AD (U01AG046161 e U01AG061357) com base em amostras fornecidas pelo Rush Alzheimer's Disease Center, Rush University Medical Center, Chicago. A coleta de dados foi apoiada por meio de financiamento de subsídios do NIA P30AG10161, R01AG15819, R01AG17917, R01AG30146, R01AG36836, U01AG32984, U01AG46152, do Departam....

Materials

Name	Company	Catalog Number	Comments
Computer	Apple	Mac Studio	Apple M1 Ultra with 20-core CPU, 48-core GPU, 32-core Neural Engine; 64 GB unified memory
Conda v23.3.1	Anaconda, Inc.	N/A	package management system and environment manager
conda environment DeepOmicsAE	N/A	DeepOmicsAE_env.yml	contains packages necessary to run the worflow
github repository DeepOmicsAE	Microsoft	https://github.com/elepan84/DeepOmicsAE/	provides scripts, Jupyter notebooks, and the conda environment file
Jupyter notebook v6.5.4	Project Jupyter	N/A	a platform for interactive data science and scientific computing
DT01-metabolomics data	N/A	ROSMAP_Metabolon_HD4_Brain 514_assay_data.csv	This data was used to generate the Results reported in the article. Specifically, DT01-DT04 were merged by matching them based on the individualID. The column final consensus diagnosis (cogdx) was filtered to keep only patients classified as healthy or AD. Climnical features were filtered to keep the following: age at death, sex and education. Finally, age reported as 90+ was set to 91, then the age column was transformed to float64. The data is available at https://adknowledgeportal.synapse.org
DT02-TMT proteomics data	N/A	C2.median_polish_corrected_log2 (abundanceRatioCenteredOn MedianOfBatchMediansPer Protein)-8817x400.csv
DT03-clinical data	N/A	ROSMAP_clinical.csv
DT04-biospecimen metadata	N/A	ROSMAP_biospecimen_metadata .csv
Python 3.11.3	Python Software Foundation	N/A	programming language

References

Hou, Y., et al. Ageing as a risk factor for neurodegenerative disease. Nature Reviews Neurology. 15 (10), 565-581 (2019).
Scheltens, P., et al. Alzheimer’s disease. The Lancet. 397 (10284), 1577-1590 (2021).
Brei....

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Explore More Articles

Biologia Edi o 202

This article has been published

Video Coming Soon

Keep me updated: