このコンテンツを視聴するには、JoVE 購読が必要です。 サインイン又は無料トライアルを申し込む。
本稿では、メタボロミクスデータのデータ駆動型ネットワーク構築と解析のための2つのツールであるCorrelationCalculatorとFiligreeを紹介します。 CorrelationCalculator は、発現データに基づく代謝物の単一の相互作用ネットワークの構築をサポートし、Filigree は差動ネットワークの構築と、それに続くネットワークのクラスタリングと濃縮分析を可能にします。
オミクスデータの解析における重要な課題は、実用的な生物学的知識を抽出することです。メタボロミクスも例外ではありません。個々の代謝産物のレベルの変化を特定の生物学的プロセスに関連付けるという一般的な問題は、ノンターゲット液体クロマトグラフィー質量分析(LC-MS)研究に存在する多数の未知の代謝物によって悪化します。さらに、二次代謝と脂質代謝は、既存のパスウェイデータベースでは十分に表現されていません。これらの限界を克服するために、私たちのグループでは、データ駆動型ネットワークの構築と解析のためのいくつかのツールを開発しました。これらには、CorrelationCalculator と Filigree が含まれます。どちらのツールも、代謝物の数がサンプル数を超えた場合に、実験メタボロミクスデータから部分相関ベースのネットワークを構築できます。CorrelationCalculator は 1 つのネットワークの構築をサポートしますが、Filigree では 2 つのサンプル グループからのデータを利用して差分ネットワークを構築し、その後にネットワーク クラスタリングとエンリッチメント分析を行うことができます。本稿では、実際のメタボロミクスデータを解析するための両ツールの有用性と応用について述べる。
過去10年間で、メタボロミクスは、ガスクロマトグラフ質量分析(GC-MS)や液体クロマトグラフィー質量分析(LC-MS)などの分析技術の進歩により、オミクス科学として登場しました。これらの技術により、数百から数千の低分子代謝物を同時に測定し、複雑な多次元データセットを作成できます。メタボロミクス実験は、ターゲットモードまたはノンターゲットモードで実行できます。ターゲットメタボロミクス実験では、特定のクラスの代謝物を測定します。それらは通常仮説主導型ですが、ノンターゲットアプローチはできるだけ多くの代謝物を測定しようとし、本質的に仮説を生成します。ターゲットアッセイには通常、内部標準が含まれているため、目的の代謝物の絶対定量が可能です。対照的に、ノンターゲットアッセイでは相対定量が可能で、多くの未知の代謝物が含まれています1。
メタボロミクスデータの解析は、多くの専用ソフトウェアツールを活用する多段階のプロセスです1。大きく分けて、(1)データ処理と品質管理、(2)統計解析、(3)生物学的データの解釈の3つに分けられます。ここで説明するツールは、解析の後半のステップを可能にするように設計されています。
メタボロミクスデータを解釈する直感的で一般的な方法は、実験測定値を代謝経路にマッピングすることです。この2,3,4,5を実現するために、私たちのグループ6によって開発されたMetscapeを含む多くのツールが設計されました。パスウェイマッピングは、多くの場合、最も重要なパスウェイを特定するのに役立つエンリッチメント分析と組み合わされます7,8。これらの手法は、遺伝子発現データの解析において最初に注目され、プロテオミクスおよびエピゲノミクスデータの解析に応用されてきました9,10,11,12,13。しかし、メタボロミクスデータの解析には、知識ベースのアプローチには多くの課題があります。まず、メタボロミクスアッセイでは、内因性代謝物に加えて、栄養やその他の環境源に由来するものを含む外因性化合物を測定します。これらの化合物は、細菌によって産生される代謝産物と同様に、他の真核生物のヒトまたは代謝経路にマッピングすることはできません。さらに、二次代謝および脂質代謝の経路カバレッジは、現在、データの生物学的解釈を容易に支持するレベルでの高解像度マッピングを可能にしていない14,15。
データ駆動型のネットワーク解析手法は、これらの課題の克服に役立ちます。例えば、相関ベースのネットワークは、既知および未知の両方の代謝物間の関係を導出し、未知物質のアノテーションを容易にする16。ピアソンの相関係数を計算することは、代謝物間の線形関係を確立するための最も簡単なアプローチですが、欠点は、直接的および間接的な関連性17,18,19の両方を捉えることです。別の方法として、直接的な関連性と間接的な関連性を区別できる偏相関係数を計算する方法があります。ガウス グラフィカル モデリング (GGM) を使用して、偏相関ネットワークを推定できます。ただし、GGMでは、サンプルサイズと特徴の数が同等である必要があります。この条件は、何千もの代謝特性の測定値を含むノンターゲット LC-MS データではめったに満たされません。正則化手法は、この制限を克服するために利用できます。グラフィカルななげなわ(Glasso)とノードワイズ回帰は、偏相関ネットワーク16,20の正則化推定のための一般的な方法です。
ここで紹介するバイオインフォマティクスツールの最初の CorrelationCalculator16 は、偏りのない疎部分相関 (DSPC) アルゴリズムに基づいています。DSPC は、疎分散化されたグラフィカルななげなわモデリングに依存しています。アルゴリズムの根底にある仮定は、代謝産物間の結合の数がサンプル数よりもかなり少ない、つまり代謝産物の偏相関ネットワークが疎であるということです。この仮定により、DSPCは、正則化された回帰手法を活用して、より少ないサンプルで多数の代謝物間の接続性を発見できます。さらに、正則化された回帰推定値にバイアス除去ステップを使用して、信頼区間を構築し、関心のある仮説(たとえば、単一またはエッジのグループの有無)をテストするために使用できるエッジパラメータのサンプリング分布を取得します。したがって、偏相関ネットワークにおけるエッジの有無は、計算されたp値を使用して正式にテストできます。
CorrelationCalculator は、単一グループ分析に非常に役立つことが証明されました16。しかし、多くのメタボロミクス実験の目的は、2つ以上の条件の差動分析です。CorrelationCalculator を各グループで個別に使用して、各条件の偏相関ネットワークを生成できますが、この方法では、ネットワーク生成に使用できるサンプルの数が制限されます。データドリブン解析では、サンプルサイズが十分に大きいことが最大の考慮事項の1つであるため、データ内の利用可能なすべてのサンプルを活用してネットワークを構築できる手法が強く望まれます。このアプローチは、ここで紹介する 2 番目のツールである Filigree21 に実装されています。Filigreeは、以前に公開された差分ネットワークエンリッチメント分析(DNEA)アルゴリズム22に依存しています。 表 1 は、両方のツールのアプリケーションとワークフローを示しています。
実験条件数(k) | k = 1 | k = 2 |
ソフトウェアツール | 相関電卓 | 細工 |
入力データ | • 代謝物 x サンプルデータマトリックス | • 代謝物 x サンプルデータマトリックス • 実験グループ |
ワークフロー •前処理 • ネットワーク推定 • ネットワーク クラスタリング • エンリッチメント分析 | •ログ変換。自動スケーリング • DSPC (英語) •外部アプリ経由 •いいえ | •ログ変換。自動スケーリング • 共同ネットワーク推定 • コンセンサスクラスタリング • NetGSAの |
データの可視化 | 外部アプリ(例:Cytoscape)経由 | 外部アプリ(例:Cytoscape)経由 |
関心のある結果との関連について代謝モジュールをテストする(オプション) | 外部アプリ経由 | 外部アプリ経由 |
表1:CorrelationCalculatorとFiligreeの適用範囲とワークフロー。
1.相関電卓
2.フィリグリー
3. その他の考慮事項
CorrelationCalculatorの使用を説明するために、 Krumsiek et al.24に記載されているKORA集団研究のメタボロミクスデータのサブセットを使用して偏相関ネットワークを構築しました。データセットには、151 の代謝物と 240 のサンプルが含まれていました。 図1 は、Cytoscapeで可視化した偏相関ネットワークを示しています。ネットワークには 148 個のノード?...
CorrelationCalculator と Filigree に実装された部分相関ベースのネットワーク解析手法は、特に未知の代謝物の有病率が高く、代謝経路のカバレッジが限られているデータセット(リピドミクスデータなど)において、知識ベースの代謝経路解析の限界を克服するのに役立ちます。これらのツールは、幅広いメタボロミクスおよびリピドミクスデータを分析するために研究コミュニティで広く使用され...
著者は競合する金銭的利害関係を持っていません。
この研究は、NIH 1U01CA235487助成金の支援を受けました。
Name | Company | Catalog Number | Comments |
CorrelationCalculator | JAVA | http://metscape.med.umich.edu/calculator.html | |
clusterNet | https://github.com/Karnovsky-Lab/clusterNet | ||
Cytoscape | Cytoscape | https://cytoscape.org/ | |
Filigree | JAVA | http://metscape.med.umich.edu/filigree.html | |
MetScape | Cytoscape | https://apps.cytoscape.org/apps/metscape | Cytoscape application that allows for the creation and exploration of correlation networks. |
このJoVE論文のテキスト又は図を再利用するための許可を申請します
許可を申請さらに記事を探す
This article has been published
Video Coming Soon
Copyright © 2023 MyJoVE Corporation. All rights reserved