メタボロミクスデータ解析は、多くの専用ソフトウェアツールを活用する多段階のプロセスです。このデータ分析は、データ処理と品質管理、統計分析、生物学的データの解釈の3つの主要なステップに分けることができます。このプロトコルで説明するツールは、分析の後半のステップを可能にするように設計されています。
過去10年間で、メタボロミクスは、ガスクロマトグラフ質量分析法や液体クロマトグラフ質量分析法などの分析技術の進歩により、アノミック科学として登場しました。これらの技術により、数百から数千の低分子代謝物を同時に測定し、複雑な多次元データセットを作成できます。メタボロミクスデータ解析は、パスウェイベースの濃縮アプローチにいくつかの課題を提示します。
第一に、かなりの数の代謝産物を代謝経路にマッピングすることはできません。さらに、二次代謝および脂質代謝の経路カバレッジは十分ではありません。したがって、データの生物学的解釈には別のアプローチが必要です。
データ駆動型ネットワーク解析手法は、メタボロミクスデータの知識ベースのパスウェイエンリッチメント解析に関連する課題の克服に役立ちます。例えば、相関ネットワークは、既知と未知の両方の代謝物間の関係を導き出すのに役立ち、したがって、未知化合物のアノテーションを容易にすることができます。