代谢组学数据分析是一个多步骤过程,它利用了许多专门的软件工具。这种数据分析可分为三个主要步骤,数据处理和质量控制、统计分析和生物数据解释。该协议中描述的工具旨在启用分析中的后一步。
在过去的十年中,由于气相色谱-质谱法和液相色谱-质谱法等分析技术的进步,代谢组学已成为一门非正常科学。这些技术可以同时测量数百到数千种小分子代谢物,从而创建复杂的多维数据集。代谢组学数据分析为基于通路的富集方法带来了一些挑战。
首先,大量的代谢物不能定位到代谢途径上。此外,次级代谢和脂质代谢的通路覆盖率还不够。因此,需要替代方法来对数据进行生物学解释。
数据驱动的网络分析技术可以帮助克服与代谢组学数据的基于知识的通路富集分析相关的挑战。例如,相关网络可以帮助推导出已知和未知代谢物之间的关系,从而促进未知物的注释。