JoVE Logo

サインイン

このコンテンツを視聴するには、JoVE 購読が必要です。 サインイン又は無料トライアルを申し込む。

この記事について

  • 要約
  • 要約
  • 概要
  • プロトコル
  • 結果
  • ディスカッション
  • 開示事項
  • 謝辞
  • 資料
  • 参考文献
  • 転載および許可

要約

XY-MetaとmetaXを統合した非標的メタボロミクスワークフローを構築しました。このプロトコルでは、XY-Metaを使用してオープンアクセススペクトルリファレンスからデコイスペクトルライブラリを生成する方法を示し、FDR制御を行い、メタボロミクススペクトルを同定した後、metaXを使用して代謝産物を定量しました。

要約

非標的メタボロミクス技術は、近年広く使用されている。しかし、スループットとサンプル数の急速な増加は膨大な量のスペクトルを生成し、質量分析スペクトルの品質管理に課題を課しています。誤検知を減らすには、誤検出率(FDR)の品質管理が必要です。最近、我々はXY-Metaという名前のターゲット - デコイ戦略に基づく非標的メタボローム同定のFDR制御のためのソフトウェアを開発しました。ここでは、XY-Meta と metaX を統合する完全な分析パイプラインを示しました。このプロトコルは、XY-metaを使用して既存の参照データベースからおとりデータベースを生成し、オープンアクセスデータセットで大規模なメタボローム同定のためのTarget-Decoy戦略を使用してFDR制御を実行する方法を示しています。示差分析および代謝産物注釈は、代謝産物ピーク検出および定量についてmetaXを実行した後に実施した。より多くの研究者を支援するために、バイオインフォマティクスのスキルやコンピュータ言語を必要とせずに、これらの分析のためのユーザーフレンドリーなクラウドベースの分析プラットフォームも開発しました。

概要

代謝産物は、生物学的プロセスにおいて重要な役割を果たしている。代謝産物は、多くの場合、エネルギー移動、ホルモン調節、神経伝達物質の調節、細胞通信、およびタンパク質の翻訳後修飾などの様々なプロセスの調節因子である1,2,3,4。非標的メタボロミクスは、多数の代謝産物5,6のグローバルビューを提供する。質量分析およびクロマトグラフィー技術の進歩に伴い、メタボロームMS/MSスペクトルのスループットは近年急速に増加しています7、891011これらの巨大なデータセットから代謝産物を同定するために、MZmine 12、MS-FINDER 13、CFM-ID 14、MetFrag15、SLAW16など、さまざまな注釈ソフトウェア11が開発されました。ただし、これらの ID には多くの場合、多くの誤検知が含まれています。その理由としては、(1)MS/MSスペクトルにはランダムノイズが含まれており、ピークマッチングを誤解させる可能性があります。(2)異性体および断片化エネルギーの違いは、複数のスペクトルフィンガープリントを引き起こし、したがって参照ライブラリの体積を増加させる。(3) 参照ライブラリの品質はさまざまです。優れたリファレンススペクトルライブラリを構築するための適切な標準が必要です。したがって、非標的メタボロミクスのための系統的偽発見率(FDR)制御は、機能的メタボローム研究不可欠である7、8917

経験的ベイズアプローチとターゲット・デコイ戦略はどちらも、FDR制御問題全般に取り組んだ。Kerstin Scheubertらは、フラグメンテーションツリーベースの方法から生成されたおとりデータベース上のターゲット-デコイ戦略がFDR制御9のための最良の方法であることを示した。Xusheng Wangらは、化学におけるオクテット則に基づくおとり生成の方法を設計し、FDR推定の精度を向上させた17。デコイデータベースを生成するためのスペクトルライブラリは、より良いパフォーマンスのために実証されました18。ここでは、スペクトルライブラリベースの手法を改良し、FDR推定の精度をさらに向上させることができるXY-Meta19 というソフトウェアを開発しました。既存の参照スペクトルライブラリを使用して、ターゲット-デコイスキームの下でFDR制御用のデコイライブラリを生成します。XY-Metaは、独自のスペクトルマッチングアルゴリズムとコサイン類似性アルゴリズムをサポートしています。従来の検索モードと反復検索モードが可能です。FDR評価のステップでは、ターゲット - デコイ連結モードと分離モードをサポートしています。柔軟性を高めるために、XY-Meta は外部のおとりライブラリを受け入れます。

代謝産物のピーク検出および定量は、非標的メタボローム分析の重要なステップでもある。ピーク検出は、メタボローム同定の主な方法です。一般に、代謝産物のピーク検出の精度は、質量分析のノイズ信号、代謝産物の存在量の低さ、汚染物質、代謝産物の分解産物などの複数の要因によって影響を受けました20。非標的メタボロームの実験において液体クロマトグラフィーカラムを交換したか又は液体クロマトグラフィーカラムのサンプル数が多すぎると、顕著なバッチ効果が現れることがあり、これはメタボローム定量にとって大きな課題である212223現在、XCMS 24、Workflow4Metabolomic25、iMet-Q26、metaX19などのソフトウェアは、標的化されていないメタボロームのピーク検出と定量を実行できますが、metaXのパイプラインはより完全で使いやすいことを示唆しています。ここでは、XY-Metaを用いた公開データセットmsv000084112の同定とFDR制御のプロセス、およびmetaXを用いた代謝産物のピーク検出と定量を実演する。このワークフローに必要なのは 2 つのグループのみで、各グループには少なくとも 2 つのサンプルが必要です。質量分析計のプラットフォーム、イオン化モード、充電モード、サンプルタイプに関係なく、MS/MSスペクトルデータが必要であり、サンプルベースの正規化とピークベースの正規化をサポートできます。この例に続いて、研究者は扱いやすい方法でメタボロミクスの同定と定量を行うことができます。このパイプラインを使用するには、R プログラミング機能が必要です。プログラミングの知識のない研究者を支援するために、メタボロミクス分析用のクラウド分析プラットフォームも開発しました。このクラウド分析プラットフォームについては、「補足資料 5」で説明しました。

Access restricted. Please log in or start a trial to view this content.

プロトコル

1. メタボロミクスデータセットを解析用に準備する

注:このデモでは、QCサンプルなしでメタボロミクスデータセットを使用します。ケース・グループおよび制御グループのデータが必要です。デモンストレーションのために、GNPSデータベース27のパブリックデータセットを使用します。

  1. Web ページの https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp に移動します。[データセットの参照] をクリックします。
  2. [タイトル] 列でキーワード "msv000084112" を検索します。詳細についてはデータセットID番号をクリックし、FTPを使用してデータセットをダウンロードします。
  3. 生データをフォルダー /msv000084112 に配置します。
    注: このデータセットは、ポジティブ モードで Q Exactive プラットフォーム上の C18 RP-UHPLC を使用して取得されました。尿の代謝の特徴のない疾患を有するコホートを表す試料データは、健常人の33試料、12個のブランク試料、2個の混合試料、および患者28 の82個の試料を含む(補足資料8)。ワークフローを実証するために、対照群として健常者(NH)の6つのサンプルを無作為に選択し、症例群として疾患(NT)を含む6つのサンプルを無作為に選択してワークフローを実行しました。

2. データ形式変換

注: データセットが質量分析計から直接生成された生データである場合、通常は .raw、.wiff、または .cdf 形式です。これらは mzXML および mgf 形式に変換する必要があります。ここでは、ProteoWizard29 パッケージのmsconvertツールを使用してフォーマット変換を行います。

  1. https://proteowizard.sourceforge.io/download.html からプロテオウィザードをダウンロードし、インストールします。
  2. ProteoWizard のインストールパスの下にある msconvert.exe を使用してデータ形式を変換します。
    1. 生データを mzXML 形式に変換して /mzXML フォルダに格納します:/msconvert.exe /raw/*.raw -o /raw/mzXML/ --filter "peakPicking true [1,2]" --filter "zeroSamples removeExtra" --mzML --zlib --mz64 --filter "msLevel 1-2" --filter "titleMaker ..<充電状態>".
    2. raw/mzXML データを mgf 形式に変換して /mgf フォルダに格納します:/msconvert.exe /msv000084112/*.raw -o /msv000084112/mgf/ --filter "peakPicking true [1,2]" --filter "zeroSamples removeExtra" --mgf --mz64 --filter "msLevel 1-2" --filter "titleMaker ...<充電状態>".

3. 代謝産物の参照スペクトルライブラリを準備する

メモ: XY-meta は、mgf 形式のリファレンススペクトルライブラリのみをサポートします。

  1. Web ページ https://gnps.ucsd.edu/ProteoSAFe/libraries.jsp に移動します。キーワード "NIST" を検索してアイテムを見つけます。[表示 ] をクリックして詳細を確認し、ライブラリをダウンロードします。
    注:GNPSパブリックスペクトルライブラリは、タイプ、起源、種、および収集モードに配置された多くの代謝産物ライブラリを収集しました。これらのライブラリのほんの一部だけが標準的な資料を使用して生成されていますが、通常、ほとんどの基礎研究には十分です。
  2. ダウンロードしたライブラリ GNPS-NIST14-MATCHES.mgf を /database フォルダに入れます。

4. 代謝産物の同定とFDR制御

  1. XY-meta (Windows 版) をダウンロードします。/XY-Meta-Win/config/ フォルダーの下にあるパラメーター構成ファイル parameter.default を見つけます。 補足資料1に従って内容を変更してください。
    注:溶液中では、代謝産物はしばしば陰イオンまたは陽イオンとの付加物を形成し、これは親イオンの質量シフトをもたらす。そのため、付加体の種類を設定する必要がある。イオン交換カラムおよび逆分析カラムの付加物リストを正電荷モードおよび負電荷モードで/adductフォルダに提供しました。ユーザーは、自分の研究プロジェクトに応じて自分の付加物リストを編集することもできます。付加物リストは、指定されたリストと同じ形式にする必要があります。
  2. XY-Meta:XY-Meta.exe -S /XY-Meta-Win/config/parameter.default -D /msv000084112/ pos_wt-1_a.mgf -R /database/GNPS-NIST14-MATCHES.mgfを使用して、代謝産物の同定とFDR制御を実行します。
    メモ: XY-Meta はパラメータのワイルドカードをサポートしていません。したがって、各 mgf ファイルの処理には 1 つのコマンドを使用する必要があります。ファイル数が多い場合は、バッチ ファイルをお勧めします。

5. 微分解析

注: metaX はオープンソースの R パッケージです。https://github.com/wenbostar/metaX のガイドに従ってインストールしてください。この分析には8GBのRAMが必要です。

  1. sampleList.txt ファイルを編集して、サンプルとそれに対応する MS データを指定します。 補足資料2をご参照ください。
    注: metaX は、QC サンプルを含むデータセットの定量分析をサポートしています。QC サンプルを使用する場合は、QC サンプルのクラス プロパティを NA に変更してください。
  2. 定量分析の結果を格納するための/outputフォルダを作成します。R を使用して 補足資料 3 のスクリプトを実行し、metaX を使用して MOCK グループと WT グループを定量化します。
    メモ: 補足資料 3 でスクリプトを実行する前に、スクリプト内のパスを実際のローカル パスに変更してください。

6. 定性的結果と定量的結果の統合

  1. 補足資料 4 の R スクリプトを実行して、代謝産物の同定を使用した定性的および定量的分析でピークに注釈を付けます。
    注: 補足資料 4 のスクリプトを実行する前に、スクリプト内のパスを実際のローカル パスに変更してください。

Access restricted. Please log in or start a trial to view this content.

結果

msv000084112の生データは、msconvert.exeによって変換され、mgfファイルが生成されました(補足資料S6)。

XY-Meta は GNPS-NIST14-MATCHES_Decoy.mgf ファイルを /database フォルダの下に生成しました。これは、元の参照スペクトルライブラリGNPS-NIST14-MATCHES.mgfから生成されたデコイライブラリです。このおとりライブラリは再利用できます。このおとりライブラリを再利用すると...

Access restricted. Please log in or start a trial to view this content.

ディスカッション

標的とならない代謝産物のFDR制御は大きな課題でした。ここでは、FDRコントロールによる大規模な非標的メタボロミクス分析(定性的および定量的)の完全なパイプラインを実証しました。これにより、MS分析で非常に一般的な誤検知が効果的に減少します。

研究に適したリファレンススペクトルライブラリを準備することは重要なポイントです。MS/MSの識別を成功させる?...

Access restricted. Please log in or start a trial to view this content.

開示事項

利益相反の禁止。

謝辞

この研究は、国家キー研究開発プログラム(2018YFC0910200/2017YFA0505001)と広東キーR&Dプログラム(2019B020226001)によってサポートされています。

Access restricted. Please log in or start a trial to view this content.

資料

NameCompanyCatalog NumberComments
GNPSopen sourcen/ahttps://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp
XY-Metaopen sourcen/ahttps://github.com/DLI-ShenZhen/XY-Meta
metaXopen sourcen/ahttps://github.com/wenbostar/metaX
ProteoWizardFree Download3.0.22116.18c918b-x86_64https://proteowizard.sourceforge.io/download.html
CHI.ClientFree Downloadndp48-x86-x64-allos-enuhttp://www.chi-biotech.com/technology.html?ty=ypt

参考文献

  1. Misra, B. B., Fahrmann, J. F., Grapov, D. Review of emerging metabolomic tools and resources: 2015-2016. Electrophoresis. 38 (18), 2257-2274 (2017).
  2. Idle, J. R., Gonzalez, F. J. Metabolomics. Cell Metabolism. 6 (5), 348-351 (2007).
  3. Fiehn, O. Metabolomics — the link between genotypes and phenotypes. Functional Genomics. Town, C. , Springer. Netherlands. Dordrecht. 155-171 (2002).
  4. Functional Genomics. Town, C. , Springer. Netherlands. Dordrecht. (2002).
  5. Dettmer, K., Aronov, P. A., Hammock, B. D. Mass spectrometry-based metabolomics. Mass Spectrometry Reviews. 26 (1), 51-78 (2007).
  6. Vinayavekhin, N., Saghatelian, A. Untargeted metabolomics. Current Protocols in Molecular Biology. , Chapter 30, Unit 30.1 1-24 (2010).
  7. Chaleckis, R., Meister, I., Zhang, P., Wheelock, C. E. Challenges, progress and promises of metabolite annotation for LC-MS-based metabolomics. Current Opinion in Biotechnology. 55, 44-50 (2019).
  8. Palmer, A., et al. FDR-controlled metabolite annotation for high-resolution imaging mass spectrometry. Nature Methods. 14 (1), 57-60 (2017).
  9. Scheubert, K., et al. Significance estimation for large scale metabolomics annotations by spectral matching. Nature Communications. 8 (1), 1494(2017).
  10. Schrimpe-Rutledge, A. C., Codreanu, S. G., Sherrod, S. D., McLean, J. A. Untargeted metabolomics strategies-challenges and emerging directions. Journal of the American Society for Mass Spectrometry. 27 (12), 1897-1905 (2016).
  11. Blaženović, I., Kind, T., Ji, J., Fiehn, O. Software tools and approaches for compound identification of LC-MS/MS data in metabolomics. Metabolites. 8 (2), (2018).
  12. Katajamaa, M., Miettinen, J., Oresic, M. MZmine: toolbox for processing and visualization of mass spectrometry based molecular profile data. Bioinformatics. 22 (5), Oxford, England. 634-636 (2006).
  13. Tsugawa, H., et al. Hydrogen rearrangement rules: computational MS/MS fragmentation and structure elucidation using MS-FINDER software. Analytical chemistry. 88 (16), 7946-7958 (2016).
  14. Wang, F., et al. CFM-ID 4.0: More accurate ESI-MS/MS spectral prediction and compound identification. Analytical Chemistry. 93 (34), 11692-11700 (2021).
  15. Ruttkies, C., Schymanski, E. L., Wolf, S., Hollender, J., Neumann, S. MetFrag relaunched: incorporating strategies beyond in silico fragmentation. Journal of Cheminformatics. 8, 3(2016).
  16. Delabriere, A., Warmer, P., Brennsteiner, V., Zamboni, N. SLAW: A scalable and self-optimizing processing workflow for untargeted LC-MS. Analytical chemistry. 93 (45), 15024-15032 (2021).
  17. Wang, X., et al. Target-decoy-based false discovery rate estimation for large-scale metabolite identification. Journal of Proteome Research. 17 (7), 2328-2334 (2018).
  18. Li, D., et al. XY-Meta: a high-efficiency search engine for large-scale metabolome annotation with accurate FDR estimation. Analytical Chemistry. 92 (8), 5701-5707 (2020).
  19. Wen, B., Mei, Z., Zeng, C., Liu, S. metaX: a flexible and comprehensive software for processing metabolomics data. BMC Bioinformatics. 18 (1), 183(2017).
  20. Aberg, K. M., Torgrip, R. J. O., Kolmert, J., Schuppe-Koistinen, I., Lindberg, J. Feature detection and alignment of hyphenated chromatographic-mass spectrometric data. Extraction of pure ion chromatograms using Kalman tracking. Journal of Chromatography. A. 1192 (1), 139-146 (2008).
  21. Liu, Q., et al. Addressing the batch effect issue for LC/MS metabolomics data in data preprocessing. Scientific Reports. 10 (1), 13856(2020).
  22. Han, W., Li, L. Evaluating and minimizing batch effects in metabolomics. Mass Spectrometry Reviews. 41 (3), 421-442 (2022).
  23. Fei, F., Bowdish, D. M. E., McCarry, B. E. Comprehensive and simultaneous coverage of lipid and polar metabolites for endogenous cellular metabolomics using HILIC-TOF-MS. Analytical and Bioanalytical Chemistry. 406 (15), 3723-3733 (2014).
  24. Smith, C. A., Want, E. J., O'Maille, G., Abagyan, R., Siuzdak, G. XCMS: processing mass spectrometry data for metabolite profiling using nonlinear peak alignment, matching, and identification. Analytical Chemistry. 78 (3), 779-787 (2006).
  25. Giacomoni, F., et al. Workflow4Metabolomics: a collaborative research infrastructure for computational metabolomics. Bioinformatics. 31 (9), Oxford, England. 1493-1495 (2015).
  26. Chang, H. -Y., et al. iMet-Q: A user-friendly tool for label-free metabolomics quantitation using dynamic peak-width determination. PloS One. 11 (1), 0146112(2016).
  27. Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
  28. Schmid, R., et al. Ion identity molecular networking for mass spectrometry-based metabolomics in the GNPS environment. Nature Communications. 12 (1), 3832(2021).
  29. Kessner, D., Chambers, M., Burke, R., Agus, D., Mallick, P. ProteoWizard: open source software for rapid proteomics tools development. Bioinformatics. 24 (21), Oxford, England. 2534-2536 (2008).
  30. Johnson, S. R., Lange, B. M. Open-access metabolomics databases for natural product research: present capabilities and future potential. Frontiers in Bioengineering and Biotechnology. 3, 22(2015).
  31. Horai, H., et al. MassBank: a public repository for sharing mass spectral data for life sciences. Journal of Mass Spectrometry: JMS. 45 (7), 703-714 (2010).
  32. Rawlinson, C., et al. Hierarchical clustering of MS/MS spectra from the firefly metabolome identifies new lucibufagin compounds. Scientific Reports. 10 (1), 6043(2020).

Access restricted. Please log in or start a trial to view this content.

転載および許可

このJoVE論文のテキスト又は図を再利用するための許可を申請します

許可を申請

さらに記事を探す

187

This article has been published

Video Coming Soon

JoVE Logo

個人情報保護方針

利用規約

一般データ保護規則

研究

教育

JoVEについて

Copyright © 2023 MyJoVE Corporation. All rights reserved