Zum Anzeigen dieser Inhalte ist ein JoVE-Abonnement erforderlich. Melden Sie sich an oder starten Sie Ihre kostenlose Testversion.
DeepOmicsAE ist ein Workflow, der sich auf die Anwendung einer Deep-Learning-Methode (d. h. eines Autoencoders) konzentriert, um die Dimensionalität von Multi-Omics-Daten zu reduzieren, und bietet eine Grundlage für Vorhersagemodelle und Signalisierungsmodule, die mehrere Schichten von Omics-Daten darstellen.
Große Omics-Datensätze werden zunehmend für die Erforschung der menschlichen Gesundheit verfügbar. In diesem Artikel wird DeepOmicsAE vorgestellt, ein Workflow, der für die Analyse von Multi-Omics-Datensätzen, einschließlich Proteomik, Metabolomik und klinischer Daten, optimiert ist. Dieser Workflow verwendet eine Art neuronales Netzwerk namens Autoencoder, um einen präzisen Satz von Features aus den hochdimensionalen Multi-Omics-Eingabedaten zu extrahieren. Darüber hinaus bietet der Workflow eine Methode zur Optimierung der Schlüsselparameter, die für die Implementierung des Autoencoders erforderlich sind. Um diesen Arbeitsablauf zu veranschaulichen, wurden klinische Daten aus einer Kohorte von 142 Personen analysiert, die entweder gesund waren oder bei denen Alzheimer diagnostiziert wurde, zusammen mit dem Proteom und Metabolom ihrer postmortalen Gehirnproben. Die aus der latenten Schicht des Autoencoders extrahierten Merkmale behalten die biologischen Informationen bei, die gesunde und kranke Patienten trennen. Darüber hinaus stellen die einzelnen extrahierten Merkmale unterschiedliche molekulare Signalmodule dar, von denen jedes einzigartig mit den klinischen Merkmalen der Individuen interagiert und ein Mittel zur Integration der Proteomik, Metabolomik und klinischen Daten bietet.
Ein immer größerer Teil der Bevölkerung altert und die Belastung durch altersbedingte Krankheiten wie Neurodegeneration wird in den kommenden Jahrzehnten voraussichtlich stark zunehmen1. Die Alzheimer-Krankheit ist die häufigste Form der neurodegenerativen Erkrankung2. Der Fortschritt bei der Suche nach einer Behandlung war langsam, da wir die grundlegenden molekularen Mechanismen, die den Ausbruch und das Fortschreiten der Krankheit bestimmen, nur unzureichend verstehen. Der Großteil der Informationen über die Alzheimer-Krankheit wird post mortem aus der Untersuchung von Hirngewebe gewonnen, was die Unterscheidung von U....
HINWEIS: Bei den hier verwendeten Daten handelt es sich um ROSMAP-Daten, die vom AD Knowledge-Portal heruntergeladen wurden. Für das Herunterladen und Wiederverwenden der Daten ist keine Einwilligung nach Aufklärung erforderlich. Das hierin vorgestellte Protokoll verwendet Deep Learning, um Multi-Omics-Daten zu analysieren und Signalmodule zu identifizieren, die bestimmte Patienten- oder Stichprobengruppen beispielsweise basierend auf ihrer Diagnose unterscheiden. Das Protokoll liefert auch einen kleinen Satz extrahierter Merkmale, die die ursprünglichen großen Daten zusammenfassen und für weitere Analysen verwendet werden können, z. B. zum Trainieren eines Vorhersage....
Um das Protokoll zu präsentieren, analysierten wir einen Datensatz, der das Proteom, das Metabolom und klinische Informationen aus postmortalen Gehirnen von 142 Personen umfasste, die entweder gesund waren oder bei denen Alzheimer diagnostiziert wurde.
Nach Durchführung des Protokollabschnitts 1 zur Vorverarbeitung der Daten enthielt der Datensatz 6.497 Proteine, 443 Metaboliten und drei klinische Merkmale (Geschlecht, Sterbealter und Bildung). Das Zielmerkmal ist die klinische Konse.......
Die Struktur des Datensatzes ist entscheidend für den Erfolg des Protokolls und sollte sorgfältig überprüft werden. Die Daten sollten wie in Protokollabschnitt 1 angegeben formatiert sein. Auch die korrekte Zuordnung von Spaltenpositionen ist entscheidend für den Erfolg der Methode. Proteomik- und Metabolomik-Daten werden unterschiedlich vorverarbeitet und die Merkmalsauswahl wird aufgrund der unterschiedlichen Art der Daten separat durchgeführt. Daher ist es wichtig, die Spaltenpositionen in den Protokollschritten.......
Der Autor erklärt, dass er keine Interessenkonflikte hat.
Diese Arbeit wurde durch NIH Grant CA201402 und den Cornell Center for Vertebrate Genomics (CVG) Distinguished Scholar Award unterstützt. Die hier veröffentlichten Ergebnisse basieren ganz oder teilweise auf Daten aus dem AD Knowledge Portal (https://adknowledgeportal.org). Die Studiendaten wurden von der Accelerating Medicine Partnership for AD (U01AG046161 und U01AG061357) auf der Grundlage von Proben bereitgestellt, die vom Rush Alzheimer's Disease Center, Rush University Medical Center, Chicago, zur Verfügung gestellt wurden. Die Datenerhebung wurde durch NIA-Zuschüsse P30AG10161, R01AG15819, R01AG17917, R01AG30146, R01AG36836, U01AG32984, U01AG46152, das Illinois....
Name | Company | Catalog Number | Comments |
Computer | Apple | Mac Studio | Apple M1 Ultra with 20-core CPU, 48-core GPU, 32-core Neural Engine; 64 GB unified memory |
Conda v23.3.1 | Anaconda, Inc. | N/A | package management system and environment manager |
conda environment DeepOmicsAE | N/A | DeepOmicsAE_env.yml | contains packages necessary to run the worflow |
github repository DeepOmicsAE | Microsoft | https://github.com/elepan84/DeepOmicsAE/ | provides scripts, Jupyter notebooks, and the conda environment file |
Jupyter notebook v6.5.4 | Project Jupyter | N/A | a platform for interactive data science and scientific computing |
DT01-metabolomics data | N/A | ROSMAP_Metabolon_HD4_Brain 514_assay_data.csv | This data was used to generate the Results reported in the article. Specifically, DT01-DT04 were merged by matching them based on the individualID. The column final consensus diagnosis (cogdx) was filtered to keep only patients classified as healthy or AD. Climnical features were filtered to keep the following: age at death, sex and education. Finally, age reported as 90+ was set to 91, then the age column was transformed to float64. The data is available at https://adknowledgeportal.synapse.org |
DT02-TMT proteomics data | N/A | C2.median_polish_corrected_log2 (abundanceRatioCenteredOn MedianOfBatchMediansPer Protein)-8817x400.csv | |
DT03-clinical data | N/A | ROSMAP_clinical.csv | |
DT04-biospecimen metadata | N/A | ROSMAP_biospecimen_metadata .csv | |
Python 3.11.3 | Python Software Foundation | N/A | programming language |
Genehmigung beantragen, um den Text oder die Abbildungen dieses JoVE-Artikels zu verwenden
Genehmigung beantragenThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Alle Rechte vorbehalten