L’analyse des données métabolomiques est un processus en plusieurs étapes qui s’appuie sur de nombreux outils logiciels spécialisés. Cette analyse des données peut être divisée en trois grandes étapes, le traitement des données et le contrôle de la qualité, l’analyse statistique et l’interprétation des données biologiques. Les outils décrits dans ce protocole sont conçus pour permettre cette dernière étape de l’analyse.
Au cours de la dernière décennie, la métabolomique a émergé en tant que science anomique en raison des progrès des technologies analytiques telles que la chromatographie en phase gazeuse-spectrométrie de masse et la chromatographie liquide-spectrométrie de masse. Ces techniques permettent de mesurer simultanément des centaines, voire des milliers de métabolites de petites molécules, créant ainsi des ensembles de données multidimensionnelles complexes. L’analyse des données métabolomiques présente plusieurs défis pour les approches d’enrichissement basées sur les voies.
Premièrement, un nombre important de métabolites ne peuvent pas être cartographiés sur les voies métaboliques. De plus, la couverture des voies du métabolisme secondaire et des lipides n’est pas suffisante. Par conséquent, d’autres approches sont nécessaires pour l’interprétation biologique des données.
Les techniques d’analyse de réseau basées sur les données peuvent aider à surmonter les défis associés à l’analyse de l’enrichissement des voies basée sur les connaissances pour les données métabolomiques. Par exemple, les réseaux de corrélation peuvent aider à établir des relations entre les métabolites connus et inconnus, et peuvent ainsi faciliter l’annotation des inconnues.