A subscription to JoVE is required to view this content. Sign in or start your free trial.
DeepOmicsAE é um fluxo de trabalho centrado na aplicação de um método de aprendizagem profunda (ou seja, um autoencoder) para reduzir a dimensionalidade de dados multi-ômicos, fornecendo uma base para modelos preditivos e módulos de sinalização que representam várias camadas de dados ômicos.
Grandes conjuntos de dados ômicos estão se tornando cada vez mais disponíveis para pesquisas em saúde humana. Este artigo apresenta o DeepOmicsAE, um fluxo de trabalho otimizado para a análise de conjuntos de dados multi-ômicos, incluindo proteômica, metabolômica e dados clínicos. Esse fluxo de trabalho emprega um tipo de rede neural chamada autoencoder, para extrair um conjunto conciso de recursos dos dados de entrada multi-ômicos de alta dimensão. Além disso, o fluxo de trabalho fornece um método para otimizar os principais parâmetros necessários para implementar o autoencoder. Para mostrar esse fluxo de trabalho, dados clínicos foram analisados de uma coorte de 142 indivíduos saudáveis ou diagnosticados com doença de Alzheimer, juntamente com o proteoma e o metaboloma de suas amostras cerebrais post-mortem. As características extraídas da camada latente do autoencoder retêm a informação biológica que separa pacientes saudáveis e doentes. Além disso, as características individuais extraídas representam módulos de sinalização molecular distintos, cada um dos quais interage de forma única com as características clínicas dos indivíduos, fornecendo um meio para integrar os dados proteômicos, metabolômicos e clínicos.
Uma proporção cada vez maior da população está envelhecendo e espera-se que a carga de doenças relacionadas à idade, como a neurodegeneração, aumente acentuadamente nas próximas décadas1. A doença de Alzheimer é o tipo mais comum de doença neurodegenerativa2. O progresso na busca de um tratamento tem sido lento, dada a nossa fraca compreensão dos mecanismos moleculares fundamentais que impulsionam o início e o progresso da doença. A maioria das informações sobre a doença de Alzheimer é obtida post-mortem a partir do exame do tecido cerebral, o que tornou a distinção entre causas e consequências uma tarefa difícil
Observação : os dados usados aqui foram dados ROSMAP baixados do portal de conhecimento do AD. Não é necessário consentimento informado para baixar e reutilizar os dados. O protocolo aqui apresentado utiliza deep learning para analisar dados multi-ômicos e identificar módulos de sinalização que distinguem pacientes específicos ou grupos amostrais baseados, por exemplo, em seu diagnóstico. O protocolo também fornece um pequeno conjunto de recursos extraídos que resumem os dados originais em grande escala e po.......
Para mostrar o protocolo, analisamos um conjunto de dados que compreende o proteoma, metaboloma e informações clínicas derivadas de cérebros post-mortem de 142 indivíduos saudáveis ou diagnosticados com doença de Alzheimer.
Após a realização da seção 1 do protocolo para pré-processar os dados, o conjunto de dados incluiu 6.497 proteínas, 443 metabólitos e três características clínicas (sexo, idade ao morrer e educação). A característica alvo é o diagnóstico de co.......
A estrutura do conjunto de dados é crítica para o sucesso do protocolo e deve ser cuidadosamente verificada. Os dados devem ser formatados conforme indicado na seção 1 do protocolo. A atribuição correta de posições de coluna também é fundamental para o sucesso do método. Os dados proteômicos e metabolômicos são pré-processados de forma diferente e a seleção de características é conduzida separadamente devido à natureza diferente dos dados. Portanto, é fundamental atribuir posições de coluna correta.......
Este trabalho foi apoiado pelo NIH grant CA201402 e pelo Cornell Center for Vertebrate Genomics (CVG) Distinguished Scholar Award. Os resultados aqui publicados são, no todo ou em parte, baseados em dados obtidos do Portal de Conhecimento do AD (https://adknowledgeportal.org). Os dados do estudo foram fornecidos através da Accelerating Medicine Partnership for AD (U01AG046161 e U01AG061357) com base em amostras fornecidas pelo Rush Alzheimer's Disease Center, Rush University Medical Center, Chicago. A coleta de dados foi apoiada por meio de financiamento de subsídios do NIA P30AG10161, R01AG15819, R01AG17917, R01AG30146, R01AG36836, U01AG32984, U01AG46152, do Departam....
Name | Company | Catalog Number | Comments |
Computer | Apple | Mac Studio | Apple M1 Ultra with 20-core CPU, 48-core GPU, 32-core Neural Engine; 64 GB unified memory |
Conda v23.3.1 | Anaconda, Inc. | N/A | package management system and environment manager |
conda environment DeepOmicsAE | N/A | DeepOmicsAE_env.yml | contains packages necessary to run the worflow |
github repository DeepOmicsAE | Microsoft | https://github.com/elepan84/DeepOmicsAE/ | provides scripts, Jupyter notebooks, and the conda environment file |
Jupyter notebook v6.5.4 | Project Jupyter | N/A | a platform for interactive data science and scientific computing |
DT01-metabolomics data | N/A | ROSMAP_Metabolon_HD4_Brain 514_assay_data.csv | This data was used to generate the Results reported in the article. Specifically, DT01-DT04 were merged by matching them based on the individualID. The column final consensus diagnosis (cogdx) was filtered to keep only patients classified as healthy or AD. Climnical features were filtered to keep the following: age at death, sex and education. Finally, age reported as 90+ was set to 91, then the age column was transformed to float64. The data is available at https://adknowledgeportal.synapse.org |
DT02-TMT proteomics data | N/A | C2.median_polish_corrected_log2 (abundanceRatioCenteredOn MedianOfBatchMediansPer Protein)-8817x400.csv | |
DT03-clinical data | N/A | ROSMAP_clinical.csv | |
DT04-biospecimen metadata | N/A | ROSMAP_biospecimen_metadata .csv | |
Python 3.11.3 | Python Software Foundation | N/A | programming language |
This article has been published
Video Coming Soon
ABOUT JoVE
Copyright © 2025 MyJoVE Corporation. All rights reserved