Zum Anzeigen dieser Inhalte ist ein JoVE-Abonnement erforderlich. Melden Sie sich an oder starten Sie Ihre kostenlose Testversion.
Wir stellen CorrelationCalculator und Filigree vor, zwei Werkzeuge für den datengesteuerten Netzwerkaufbau und die Analyse von Metabolomik-Daten. CorrelationCalculator unterstützt den Aufbau eines einzelnen Interaktionsnetzwerks von Metaboliten auf der Grundlage von Expressionsdaten, während Filigran den Aufbau eines differentiellen Netzwerks ermöglicht, gefolgt von Netzwerk-Clustering und Anreicherungsanalyse.
Eine große Herausforderung bei der Analyse von Omics-Daten ist die Gewinnung von verwertbarem biologischem Wissen. Die Metabolomik ist da keine Ausnahme. Das allgemeine Problem, Veränderungen in den Konzentrationen einzelner Metaboliten mit spezifischen biologischen Prozessen in Verbindung zu bringen, wird durch die große Anzahl unbekannter Metaboliten verschärft, die in ungezielten Flüssigchromatographie-Massenspektrometrie-Studien (LC-MS) vorhanden sind. Darüber hinaus sind der Sekundärstoffwechsel und der Fettstoffwechsel in bestehenden Signalwegdatenbanken nur unzureichend vertreten. Um diese Einschränkungen zu überwinden, hat unsere Gruppe mehrere Tools für den datengesteuerten Netzwerkaufbau und die Analyse entwickelt. Dazu gehören CorrelationCalculator und Filigree. Beide Tools ermöglichen es Benutzern, partielle korrelationsbasierte Netzwerke aus experimentellen Metabolomik-Daten zu erstellen, wenn die Anzahl der Metaboliten die Anzahl der Proben übersteigt. CorrelationCalculator unterstützt den Aufbau eines einzelnen Netzwerks, während Filigran den Aufbau eines differenziellen Netzwerks unter Verwendung von Daten aus zwei Gruppen von Stichproben ermöglicht, gefolgt von Netzwerk-Clustering und Anreicherungsanalyse. Wir werden den Nutzen und die Anwendung beider Werkzeuge für die Analyse realer Metabolomics-Daten beschreiben.
In den letzten zehn Jahren hat sich die Metabolomik aufgrund von Fortschritten in analytischen Technologien wie der Gaschromatographie-Massenspektrometrie (GC-MS) und der Flüssigkeitschromatographie-Massenspektrometrie (LC-MS) zu einer Omics-Wissenschaft entwickelt. Diese Techniken ermöglichen die gleichzeitige Messung von Hunderten bis Tausenden von niedermolekularen Metaboliten, wodurch komplexe mehrdimensionale Datensätze erstellt werden. Metabolomics-Experimente können im gezielten oder ungezielten Modus durchgeführt werden. Gezielte Metabolomik-Experimente messen bestimmte Klassen von Metaboliten. Sie sind in der Regel hypothesengetrieben, während ungezielte Ansätze versuchen, so viele Metaboliten wie möglich zu messen, und hypothesengenerierender Natur sind. Gezielte Assays enthalten in der Regel interne Standards und ermöglichen so eine absolute Quantifizierung der interessierenden Metaboliten. Im Gegensatz dazu ermöglichen ungezielte Assays eine relative Quantifizierung und umfassen viele unbekannte Metaboliten1.
Die Analyse von Metabolomik-Daten ist ein mehrstufiger Prozess, der viele spezialisierte Software-Tools nutzt1. Es kann in die folgenden drei Hauptschritte unterteilt werden: (1) Datenverarbeitung und Qualitätskontrolle, (2) statistische Analyse und (3) Interpretation biologischer Daten. Die hier beschriebenen Werkzeuge sind so konzipiert, dass sie den letzten Schritt der Analyse ermöglichen.
Eine intuitive und beliebte Methode zur Interpretation von Metabolomik-Daten besteht darin, die experimentellen Messungen auf Stoffwechselwege abzubilden. Um diese 2,3,4,5 zu erreichen, wurden zahlreiche Tools entwickelt, darunter Metscape, das von unserer Gruppe6 entwickelt wurde. Die Kartierung der Signalwege wird häufig mit einer Anreicherungsanalyse kombiniert, die dabei hilft, die wichtigsten Signalwege zu identifizieren 7,8. Diese Techniken erlangten erstmals bei der Analyse von Genexpressionsdaten an Bedeutung und wurden erfolgreich für die Analyse von Proteomik- und Epigenomik-Daten eingesetzt 9,10,11,12,13. Die Analyse von Metabolomics-Daten stellt jedoch eine Reihe von Herausforderungen für wissensbasierte Ansätze dar. Erstens messen Metabolomik-Assays zusätzlich zu den endogenen Metaboliten exogene Verbindungen, einschließlich solcher, die aus der Ernährung und anderen Umweltquellen stammen. Diese Verbindungen sowie die von Bakterien produzierten Metaboliten können nicht auf menschliche oder metabolische Wege anderer eukaryotischer Organismen abgebildet werden. Darüber hinaus erlaubt die Abdeckung des Sekundärstoffwechsels und des Lipidstoffwechsels derzeit keine hochauflösende Kartierung auf einem Niveau, das die biologische Interpretation der Daten leicht unterstützen würde14,15.
Datengesteuerte Netzwerkanalysetechniken können helfen, diese Herausforderungen zu meistern. Zum Beispiel können korrelationsbasierte Netzwerke helfen, Beziehungen zwischen bekannten und unbekannten Metaboliten abzuleiten und die Annotation der Unbekannten zu erleichtern16. Während die Berechnung der Pearson-Korrelationskoeffizienten der einfachste Ansatz ist, um die linearen Beziehungen zwischen Metaboliten zu ermitteln, besteht der Nachteil darin, dass sie sowohl direkte als auch indirekte Assoziationen erfasst17,18,19. Eine Alternative besteht darin, partielle Korrelationskoeffizienten zu berechnen, die zwischen direkten und indirekten Assoziationen unterscheiden können. Die Gaußsche grafische Modellierung (GGM) kann zur Schätzung partieller Korrelationsnetzwerke verwendet werden. GGM verlangt jedoch, dass die Stichprobengröße und die Anzahl der Merkmale vergleichbar sind. Diese Bedingung ist bei ungezielten LC-MS-Daten, die Messungen für Tausende von Stoffwechselmerkmalen enthalten, selten erfüllt. Regularisierungstechniken können verwendet werden, um diese Einschränkung zu überwinden. Graphisches Lasso (Glasso) und knotenweise Regression sind beliebte Methoden zur regularisierten Schätzung des partiellen Korrelationsnetzwerks16,20.
Das erste der hier vorgestellten Bioinformatik-Werkzeuge, CorrelationCalculator16, basiert auf dem Debiased Sparse Partial Correlation (DSPC)-Algorithmus. DSPC stützt sich auf die entsparsifizierte grafische Lasso-Modellierung. Dem Algorithmus liegt die Annahme zugrunde, dass die Anzahl der Verbindungen zwischen den Metaboliten deutlich kleiner ist als die Anzahl der Proben, d.h. das partielle Korrelationsnetzwerk der Metaboliten ist spärlich. Diese Annahme ermöglicht es DSPC, die Konnektivität zwischen einer großen Anzahl von Metaboliten mit weniger Proben zu entdecken und dabei regulierte Regressionstechniken zu nutzen. Darüber hinaus erhält es unter Verwendung eines Debiasing-Schritts für die regularisierten Regressionsschätzungen Stichprobenverteilungen für die Kantenparameter, die verwendet werden können, um Konfidenzintervalle zu konstruieren und Hypothesen von Interesse zu testen (z. B. Vorhandensein/Fehlen einer einzelnen oder einer Gruppe von Kanten). Das Vorhandensein oder Fehlen einer Kante im partiellen Korrelationsnetzwerk kann somit formal mit den berechneten p-Werten getestet werden.
CorrelationCalculator erwies sich als sehr nützlich für die Einzelgruppenanalyse16; Das Ziel vieler Metabolomics-Experimente ist jedoch die differentielle Analyse von zwei oder mehr Bedingungen. Während CorrelationCalculator für jede der Gruppen separat eingesetzt werden kann, um partielle Korrelationsnetzwerke für jede Bedingung zu generieren, begrenzt dieser Ansatz die Anzahl der Stichproben, die für die Netzwerkgenerierung verwendet werden können. Da eine ausreichend große Stichprobengröße eine der wichtigsten Überlegungen bei der datengetriebenen Analyse ist, sind Methoden, die alle verfügbaren Stichproben in den Daten nutzen können, um Netzwerke zu konstruieren, sehr wünschenswert. Dieser Ansatz wird im zweiten hier vorgestellten Tool mit dem Namen Filigran21 umgesetzt. Filigree stützt sich auf den zuvor veröffentlichten DNEA-Algorithmus (Differential Network Enrichment Analysis)22. Tabelle 1 zeigt die Anwendungen und den Workflow beider Tools.
Anzahl der Versuchsbedingungen (k) | k = 1 | k = 2 |
Programmentwicklungssystem | Korrelationsrechner | Filigran |
Eingangsdaten | • Metaboliten x Proben Datenmatrix | • Metaboliten x Proben Datenmatrix • Experimentelle Gruppen |
Arbeitsablauf •Vorbehandlung • Schätzung des Netzwerks • Netzwerk-Clustering • Anreicherungsanalyse | • Log-Transformation; Automatische Skalierung • DSPC • Über externe Apps •Nein | • Log-Transformation; Automatische Skalierung • Schätzung des gemeinsamen Netzes • Konsens-Clustering • NetGSA |
Datenvisualisierung | Über externe App, z.B. Cytoscape | Über externe App, z.B. Cytoscape |
Testen von Stoffwechselmodulen auf die Assoziation mit dem interessierenden Ergebnis (optional) | Über externe Apps | Über externe Apps |
Tabelle 1: Der Anwendungsbereich und der Workflow von CorrelationCalculator und Filigree.
1. Korrelationsrechner
2. Filigran
3. Zusätzliche Erwägungen
Um die Verwendung von CorrelationCalculator zu veranschaulichen, konstruierten wir ein partielles Korrelationsnetzwerk unter Verwendung einer Teilmenge der Metabolomik-Daten aus der KORA-Populationsstudie, die in Krumsiek et al.24 beschrieben wurden. Der Datensatz enthielt 151 Metaboliten und 240 Proben. Abbildung 1 zeigt das resultierende partielle Korrelationsnetzwerk, das in Cytoscape visualisiert wurde. Das Netzwerk umfasst 148 Knoten und 272 Edges. Die F...
Partielle korrelationsbasierte Netzwerkanalysemethoden, die in CorrelationCalculator und Filigree implementiert sind, tragen dazu bei, einige der Einschränkungen wissensbasierter Stoffwechselweganalysen zu überwinden, insbesondere für Datensätze mit einer hohen Prävalenz unbekannter Metaboliten und einer begrenzten Abdeckung von Stoffwechselwegen (z. B. Lipidomik-Daten). Diese Werkzeuge werden von der Forschungsgemeinschaft häufig verwendet, um ein breites Spektrum von Metabolomik- und Lipidomik-Daten zu analysiere...
Die Autoren haben keine konkurrierenden finanziellen Interessen.
Diese Arbeit wurde durch einen NIH 1U01CA235487 Zuschuss unterstützt.
Name | Company | Catalog Number | Comments |
CorrelationCalculator | JAVA | http://metscape.med.umich.edu/calculator.html | |
clusterNet | https://github.com/Karnovsky-Lab/clusterNet | ||
Cytoscape | Cytoscape | https://cytoscape.org/ | |
Filigree | JAVA | http://metscape.med.umich.edu/filigree.html | |
MetScape | Cytoscape | https://apps.cytoscape.org/apps/metscape | Cytoscape application that allows for the creation and exploration of correlation networks. |
Genehmigung beantragen, um den Text oder die Abbildungen dieses JoVE-Artikels zu verwenden
Genehmigung beantragenThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Alle Rechte vorbehalten