Se requiere una suscripción a JoVE para ver este contenido. Inicie sesión o comience su prueba gratuita.

En este artículo

  • Resumen
  • Resumen
  • Introducción
  • Protocolo
  • Resultados Representativos
  • Discusión
  • Divulgaciones
  • Agradecimientos
  • Materiales
  • Referencias
  • Reimpresiones y Permisos

Resumen

DeepOmicsAE es un flujo de trabajo centrado en la aplicación de un método de aprendizaje profundo (es decir, un codificador automático) para reducir la dimensionalidad de los datos multiómicos, proporcionando una base para modelos predictivos y módulos de señalización que representan múltiples capas de datos ómicos.

Resumen

Los grandes conjuntos de datos ómicos están cada vez más disponibles para la investigación de la salud humana. Este artículo presenta DeepOmicsAE, un flujo de trabajo optimizado para el análisis de conjuntos de datos multiómicos, incluidos proteómicos, metabolómicos y datos clínicos. Este flujo de trabajo emplea un tipo de red neuronal denominada autocodificador para extraer un conjunto conciso de características de los datos de entrada multiómicos de alta dimensión. Además, el flujo de trabajo proporciona un método para optimizar los parámetros clave necesarios para implementar el autocodificador. Para mostrar este flujo de trabajo, se analizaron los datos clínicos de una cohorte de 142 individuos sanos o diagnosticados con la enfermedad de Alzheimer, junto con el proteoma y el metaboloma de sus muestras cerebrales postmortem. Las características extraídas de la capa latente del autocodificador retienen la información biológica que separa a los pacientes sanos de los enfermos. Además, las características individuales extraídas representan distintos módulos de señalización molecular, cada uno de los cuales interactúa de manera única con las características clínicas de los individuos, proporcionando un medio para integrar la proteómica, la metabolómica y los datos clínicos.

Introducción

Una proporción cada vez mayor de la población está envejeciendo y se espera que la carga de las enfermedades relacionadas con la edad, como la neurodegeneración, aumente drásticamente en las próximas décadas1. La enfermedad de Alzheimer es el tipo más común de enfermedad neurodegenerativa2. El progreso en la búsqueda de un tratamiento ha sido lento debido a nuestra escasa comprensión de los mecanismos moleculares fundamentales que impulsan la aparición y el progreso de la enfermedad. La mayor parte de la información sobre la enfermedad de Alzheimer se obtiene post mortem a partir del examen del tejido cerebral, lo que ha....

Protocolo

NOTA: Los datos utilizados aquí fueron datos de ROSMAP descargados del portal de conocimiento de AD. No se necesita el consentimiento informado para descargar y reutilizar los datos. El protocolo presentado en este documento utiliza el aprendizaje profundo para analizar datos multiómicos e identificar módulos de señalización que distinguen a pacientes específicos o grupos de muestras basándose, por ejemplo, en su diagnóstico. El protocolo también ofrece un pequeño conjunto de características extraídas que resumen los datos originales a gran escala y se pueden utilizar para análisis posteriores, como el entrenamiento de un modelo predictivo mediante algoritmos de apren....

Resultados Representativos

Para mostrar el protocolo, analizamos un conjunto de datos que comprendía el proteoma, el metaboloma y la información clínica derivada de los cerebros postmortem de 142 individuos sanos o diagnosticados con la enfermedad de Alzheimer.

Después de realizar la sección 1 del protocolo para preprocesar los datos, el conjunto de datos incluyó 6.497 proteínas, 443 metabolitos y tres características clínicas (sexo, edad de muerte y educación). La característica objetivo es el diagn?.......

Discusión

La estructura del conjunto de datos es fundamental para el éxito del protocolo y debe comprobarse cuidadosamente. Los datos deben formatearse como se indica en la sección 1 del protocolo. La asignación correcta de las posiciones de las columnas también es fundamental para el éxito del método. Los datos proteómicos y metabolómicos se preprocesan de manera diferente y la selección de características se realiza por separado debido a la diferente naturaleza de los datos. Por lo tanto, es fundamental asignar correct.......

Divulgaciones

El autor declara que no tiene conflictos de intereses.

Agradecimientos

Este trabajo fue financiado por el CA201402 de subvenciones de los NIH y el Premio al Académico Distinguido del Centro de Genómica de Vertebrados de Cornell (CVG). Los resultados publicados aquí se basan total o parcialmente en datos obtenidos del Portal de Conocimiento de AD (https://adknowledgeportal.org). Los datos del estudio se proporcionaron a través de la Asociación de Medicina Acelerada para la EA (U01AG046161 y U01AG061357) en base a muestras proporcionadas por el Centro de la Enfermedad de Alzheimer Rush, Centro Médico de la Universidad Rush, Chicago. La recopilación de datos fue financiada por subvenciones del NIA P30AG10161, R01AG15819, R01AG17917, R01AG30....

Materiales

NameCompanyCatalog NumberComments
ComputerAppleMac StudioApple M1 Ultra with 20-core CPU, 48-core GPU, 32-core Neural Engine; 64 GB unified memory
Conda v23.3.1Anaconda, Inc.N/Apackage management system and environment manager
conda environment
DeepOmicsAE
N/ADeepOmicsAE_env.ymlcontains packages necessary to run the worflow
github repository DeepOmicsAEMicrosofthttps://github.com/elepan84/DeepOmicsAE/provides scripts, Jupyter notebooks, and the conda environment file
Jupyter notebook v6.5.4Project JupyterN/Aa platform for interactive data science and scientific computing
DT01-metabolomics dataN/AROSMAP_Metabolon_HD4_Brain
514_assay_data.csv
This data was used to generate the Results reported in the article. Specifically, DT01-DT04 were merged by matching them based on the individualID. The column final consensus diagnosis (cogdx) was filtered to keep only patients classified as healthy or AD. Climnical features were filtered to keep the following: age at death, sex and education. Finally, age reported as 90+ was set to 91, then the age column was transformed to float64.
The data is available at https://adknowledgeportal.synapse.org
DT02-TMT proteomics dataN/AC2.median_polish_corrected_log2
(abundanceRatioCenteredOn
MedianOfBatchMediansPer
Protein)-8817x400.csv
DT03-clinical dataN/AROSMAP_clinical.csv
DT04-biospecimen metadataN/AROSMAP_biospecimen_metadata
.csv
Python 3.11.3 Python Software FoundationN/Aprogramming language

Referencias

  1. Hou, Y., et al. Ageing as a risk factor for neurodegenerative disease. Nature Reviews Neurology. 15 (10), 565-581 (2019).
  2. Scheltens, P., et al. Alzheimer’s disease. The Lancet. 397 (10284), 1577-1590 (2021).
  3. Brei....

Reimpresiones y Permisos

Solicitar permiso para reutilizar el texto o las figuras de este JoVE artículos

Solicitar permiso

Explorar más artículos

Biolog aN mero 202

This article has been published

Video Coming Soon

JoVE Logo

Privacidad

Condiciones de uso

Políticas

Investigación

Educación

ACERCA DE JoVE

Copyright © 2025 MyJoVE Corporation. Todos los derechos reservados