Anmelden

Zum Anzeigen dieser Inhalte ist ein JoVE-Abonnement erforderlich. Melden Sie sich an oder starten Sie Ihre kostenlose Testversion.

In diesem Artikel

  • Zusammenfassung
  • Zusammenfassung
  • Einleitung
  • Protokoll
  • Repräsentative Ergebnisse
  • Diskussion
  • Offenlegungen
  • Danksagungen
  • Materialien
  • Referenzen
  • Nachdrucke und Genehmigungen

Zusammenfassung

DeepOmicsAE ist ein Workflow, der sich auf die Anwendung einer Deep-Learning-Methode (d. h. eines Autoencoders) konzentriert, um die Dimensionalität von Multi-Omics-Daten zu reduzieren, und bietet eine Grundlage für Vorhersagemodelle und Signalisierungsmodule, die mehrere Schichten von Omics-Daten darstellen.

Zusammenfassung

Große Omics-Datensätze werden zunehmend für die Erforschung der menschlichen Gesundheit verfügbar. In diesem Artikel wird DeepOmicsAE vorgestellt, ein Workflow, der für die Analyse von Multi-Omics-Datensätzen, einschließlich Proteomik, Metabolomik und klinischer Daten, optimiert ist. Dieser Workflow verwendet eine Art neuronales Netzwerk namens Autoencoder, um einen präzisen Satz von Features aus den hochdimensionalen Multi-Omics-Eingabedaten zu extrahieren. Darüber hinaus bietet der Workflow eine Methode zur Optimierung der Schlüsselparameter, die für die Implementierung des Autoencoders erforderlich sind. Um diesen Arbeitsablauf zu veranschaulichen, wurden klinische Daten aus einer Kohorte von 142 Personen analysiert, die entweder gesund waren oder bei denen Alzheimer diagnostiziert wurde, zusammen mit dem Proteom und Metabolom ihrer postmortalen Gehirnproben. Die aus der latenten Schicht des Autoencoders extrahierten Merkmale behalten die biologischen Informationen bei, die gesunde und kranke Patienten trennen. Darüber hinaus stellen die einzelnen extrahierten Merkmale unterschiedliche molekulare Signalmodule dar, von denen jedes einzigartig mit den klinischen Merkmalen der Individuen interagiert und ein Mittel zur Integration der Proteomik, Metabolomik und klinischen Daten bietet.

Einleitung

Ein immer größerer Teil der Bevölkerung altert und die Belastung durch altersbedingte Krankheiten wie Neurodegeneration wird in den kommenden Jahrzehnten voraussichtlich stark zunehmen1. Die Alzheimer-Krankheit ist die häufigste Form der neurodegenerativen Erkrankung2. Der Fortschritt bei der Suche nach einer Behandlung war langsam, da wir die grundlegenden molekularen Mechanismen, die den Ausbruch und das Fortschreiten der Krankheit bestimmen, nur unzureichend verstehen. Der Großteil der Informationen über die Alzheimer-Krankheit wird post mortem aus der Untersuchung von Hirngewebe gewonnen, was die Unterscheidung von U....

Protokoll

HINWEIS: Bei den hier verwendeten Daten handelt es sich um ROSMAP-Daten, die vom AD Knowledge-Portal heruntergeladen wurden. Für das Herunterladen und Wiederverwenden der Daten ist keine Einwilligung nach Aufklärung erforderlich. Das hierin vorgestellte Protokoll verwendet Deep Learning, um Multi-Omics-Daten zu analysieren und Signalmodule zu identifizieren, die bestimmte Patienten- oder Stichprobengruppen beispielsweise basierend auf ihrer Diagnose unterscheiden. Das Protokoll liefert auch einen kleinen Satz extrahierter Merkmale, die die ursprünglichen großen Daten zusammenfassen und für weitere Analysen verwendet werden können, z. B. zum Trainieren eines Vorhersage....

Repräsentative Ergebnisse

Um das Protokoll zu präsentieren, analysierten wir einen Datensatz, der das Proteom, das Metabolom und klinische Informationen aus postmortalen Gehirnen von 142 Personen umfasste, die entweder gesund waren oder bei denen Alzheimer diagnostiziert wurde.

Nach Durchführung des Protokollabschnitts 1 zur Vorverarbeitung der Daten enthielt der Datensatz 6.497 Proteine, 443 Metaboliten und drei klinische Merkmale (Geschlecht, Sterbealter und Bildung). Das Zielmerkmal ist die klinische Konse.......

Diskussion

Die Struktur des Datensatzes ist entscheidend für den Erfolg des Protokolls und sollte sorgfältig überprüft werden. Die Daten sollten wie in Protokollabschnitt 1 angegeben formatiert sein. Auch die korrekte Zuordnung von Spaltenpositionen ist entscheidend für den Erfolg der Methode. Proteomik- und Metabolomik-Daten werden unterschiedlich vorverarbeitet und die Merkmalsauswahl wird aufgrund der unterschiedlichen Art der Daten separat durchgeführt. Daher ist es wichtig, die Spaltenpositionen in den Protokollschritten.......

Offenlegungen

Der Autor erklärt, dass er keine Interessenkonflikte hat.

Danksagungen

Diese Arbeit wurde durch NIH Grant CA201402 und den Cornell Center for Vertebrate Genomics (CVG) Distinguished Scholar Award unterstützt. Die hier veröffentlichten Ergebnisse basieren ganz oder teilweise auf Daten aus dem AD Knowledge Portal (https://adknowledgeportal.org). Die Studiendaten wurden von der Accelerating Medicine Partnership for AD (U01AG046161 und U01AG061357) auf der Grundlage von Proben bereitgestellt, die vom Rush Alzheimer's Disease Center, Rush University Medical Center, Chicago, zur Verfügung gestellt wurden. Die Datenerhebung wurde durch NIA-Zuschüsse P30AG10161, R01AG15819, R01AG17917, R01AG30146, R01AG36836, U01AG32984, U01AG46152, das Illinois....

Materialien

NameCompanyCatalog NumberComments
ComputerAppleMac StudioApple M1 Ultra with 20-core CPU, 48-core GPU, 32-core Neural Engine; 64 GB unified memory
Conda v23.3.1Anaconda, Inc.N/Apackage management system and environment manager
conda environment
DeepOmicsAE
N/ADeepOmicsAE_env.ymlcontains packages necessary to run the worflow
github repository DeepOmicsAEMicrosofthttps://github.com/elepan84/DeepOmicsAE/provides scripts, Jupyter notebooks, and the conda environment file
Jupyter notebook v6.5.4Project JupyterN/Aa platform for interactive data science and scientific computing
DT01-metabolomics dataN/AROSMAP_Metabolon_HD4_Brain
514_assay_data.csv
This data was used to generate the Results reported in the article. Specifically, DT01-DT04 were merged by matching them based on the individualID. The column final consensus diagnosis (cogdx) was filtered to keep only patients classified as healthy or AD. Climnical features were filtered to keep the following: age at death, sex and education. Finally, age reported as 90+ was set to 91, then the age column was transformed to float64.
The data is available at https://adknowledgeportal.synapse.org
DT02-TMT proteomics dataN/AC2.median_polish_corrected_log2
(abundanceRatioCenteredOn
MedianOfBatchMediansPer
Protein)-8817x400.csv
DT03-clinical dataN/AROSMAP_clinical.csv
DT04-biospecimen metadataN/AROSMAP_biospecimen_metadata
.csv
Python 3.11.3 Python Software FoundationN/Aprogramming language

Referenzen

  1. Hou, Y., et al. Ageing as a risk factor for neurodegenerative disease. Nature Reviews Neurology. 15 (10), 565-581 (2019).
  2. Scheltens, P., et al. Alzheimer’s disease. The Lancet. 397 (10284), 1577-1590 (2021).
  3. Brei....

Nachdrucke und Genehmigungen

Genehmigung beantragen, um den Text oder die Abbildungen dieses JoVE-Artikels zu verwenden

Genehmigung beantragen

Weitere Artikel entdecken

BiologieHeft 202

This article has been published

Video Coming Soon

JoVE Logo

Datenschutz

Nutzungsbedingungen

Richtlinien

Forschung

Lehre

ÜBER JoVE

Copyright © 2025 MyJoVE Corporation. Alle Rechte vorbehalten