A análise de dados metabolômicos é um processo de várias etapas que aproveita muitas ferramentas de software especializadas. Essa análise dos dados pode ser dividida em três grandes etapas, processamento e controle de qualidade, análise estatística e interpretação biológica dos dados. As ferramentas descritas neste protocolo são projetadas para permitir a última etapa da análise.
Na última década, a metabolômica emergiu como ciência anômica devido aos avanços em tecnologias analíticas como cromatografia gasosa-espectrometria de massas e cromatografia líquida-espectrometria de massas. Essas técnicas permitem a medição simultânea de centenas a milhares de pequenos metabólitos de moléculas, criando conjuntos de dados multidimensionais complexos. A análise de dados metabolômicos apresenta vários desafios para abordagens de enriquecimento baseado em vias.
Primeiro, um número significativo de metabólitos não pode ser mapeado em vias metabólicas. Além disso, a cobertura da via do metabolismo secundário e lipídico não é suficiente. Portanto, abordagens alternativas são necessárias para a interpretação biológica dos dados.
Técnicas de análise de rede orientadas por dados podem ajudar a superar os desafios associados à análise de enriquecimento de vias baseada em conhecimento para dados metabolômicos. Por exemplo, redes de correlação podem ajudar a derivar relações entre metabólitos conhecidos e desconhecidos, e podem, assim, facilitar anotações das incógnitas.