JoVE Logo

로그인

JoVE 비디오를 활용하시려면 도서관을 통한 기관 구독이 필요합니다. 전체 비디오를 보시려면 로그인하거나 무료 트라이얼을 시작하세요.

기사 소개

  • 요약
  • 초록
  • 서문
  • 프로토콜
  • 결과
  • 토론
  • 공개
  • 감사의 말
  • 자료
  • 참고문헌
  • 재인쇄 및 허가

요약

우리는 XY-Meta와 metaX를 함께 통합하는 표적화되지 않은 대사 산물 워크 플로우를 구축했습니다. 이 프로토콜에서는 XY-Meta를 사용하여 오픈 액세스 스펙트럼 참조에서 데코이 스펙트럼 라이브러리를 생성하는 방법을 표시 한 다음 FDR 제어를 수행하고 대사체 스펙트럼을 확인한 후 metaX를 사용하여 대사 산물을 정량화했습니다.

초록

표적화되지 않은 대사체학 기술은 최근 몇 년 동안 널리 사용되고 있다. 그러나 빠르게 증가하는 처리량과 샘플 수는 엄청난 양의 스펙트럼을 생성하므로 질량 분광법 스펙트럼의 품질 관리에 대한 문제가 발생합니다. 거짓 긍정을 줄이려면 FDR(거짓 발견률) 품질 관리가 필요합니다. 최근에, 우리는 XY-Meta라는 Target-Decoy 전략을 기반으로 하는 비표적 대사체 식별의 FDR 제어를 위한 소프트웨어를 개발했습니다. 여기서는 XY-Meta와 metaX를 함께 통합하는 완벽한 분석 파이프라인을 시연했습니다. 이 프로토콜은 XY-meta를 사용하여 기존 참조 데이터베이스에서 데코이 데이터베이스를 생성하고 오픈 액세스 데이터 세트에서 대규모 대사체 식별을 위해 Target-Decoy 전략을 사용하여 FDR 제어를 수행하는 방법을 보여줍니다. 차등 분석 및 대사산물 주석은 대사산물 피크 검출 및 정량을 위해 metaX를 실행한 후에 수행되었다. 더 많은 연구자를 돕기 위해 우리는 생물 정보학 기술이나 컴퓨터 언어가 필요없이 이러한 분석을위한 사용자 친화적 인 클라우드 기반 분석 플랫폼을 개발했습니다.

서문

대사 산물은 생물학적 과정에서 중요한 역할을합니다. 대사 산물은 종종 에너지 전달, 호르몬 조절, 신경 전달 물질의 조절, 세포 통신 및 단백질 번역 후 변형 등 1,2,3,4와 같은 다양한 과정의 조절자입니다. 표적화되지 않은 대사체학은 수많은 대사 산물 5,6에 대한 세계적인 시각을 제공합니다. 질량 분광법 및 크로마토그래피 기술의 발전으로 대사체 MS/MS 스펙트럼의 처리량 은 최근 몇 년 동안 7,8,9,10,11 급속히 증가하고 있습니다. 이러한 거대한 데이터 세트에서 대사 산물을 식별하기 위해 MZmine 12, MS-FINDER 13, CFM-ID 14, MetFrag15 및 SLAW 16과 같은 다양한 주석 소프트웨어 11이 개발되었습니다. 그러나 이러한 식별에는 종종 많은 가양성이 포함되어 있습니다. 그 이유는 다음과 같습니다 : (1) MS / MS 스펙트럼에는 피크 정합을 오도 할 수있는 임의의 잡음이 포함되어 있습니다. (2) 이성질체와 단편화 에너지의 차이는 다중 스펙트럼 지문을 유발하여 참조 라이브러리의 볼륨을 증가시킵니다. (3) 참조 라이브러리의 품질은 다양합니다. 좋은 참조 스펙트럼 라이브러리를 구축하기위한 적절한 표준이 필요합니다. 따라서, 비표적 대사체학에 대한 체계적인 허위 발견률(FDR) 조절은 기능적 대사체 연구 7,8,9,17에 필수적이다.

경험적 베이즈 접근법과 Target-Decoy 전략은 FDR 통제 문제를 일반적으로 다루었습니다. Kerstin Scheubert et al.은 단편화 트리 기반 방법으로부터 생성된 디코이 데이터베이스에 대한 Target-Decoy 전략이 FDR 제어9를 위한 최선의 방법임을 보여주었다. Xusheng Wang et al. 화학에서 옥텟 규칙에 기초한 디코이 생성 방법을 설계하고 FDR 추정17의 정밀도를 개선했습니다. decoy 데이터베이스를 생성하기 위한 스펙트럼 라이브러리는 더 나은 성능(18)을 위해 입증되었다. 여기에서는 스펙트럼 라이브러리 기반 방법을 개선하고 FDR 추정의 정밀도를 더욱 향상시킬 수있는 XY-Meta19 라는 소프트웨어를 개발했습니다. 기존 참조 스펙트럼 라이브러리를 사용하여 Target-Decoy 체계 하에서 FDR 제어를위한 디코이 라이브러리를 생성합니다. XY-Meta는 자체 스펙트럼 매칭 및 코사인 유사성 알고리즘을 지원합니다. 그것은 전통적인 검색 및 반복 검색 모드를 허용합니다. FDR 평가 단계에서는 Target-Decoy 연결 모드와 분리 모드를 지원합니다. 유연성을 높이기 위해 XY-Meta는 외부 디코이 라이브러리를 수용합니다.

대사 산물의 피크 검출 및 정량화는 또한 표적화되지 않은 대사체 분석의 중요한 단계입니다. 피크 검출은 대사체 식별을위한 주요 방법입니다. 일반적으로, 대사산물의 피크 검출의 정확도는 질량 분광분석법의 잡음 신호, 대사산물의 낮은 풍부도, 오염물 및 대사산물(20)의 분해 생성물과 같은 다수의 인자에 의해 영향을 받았다. 샘플의 수가 너무 많거나 액체 크로마토그래피 컬럼이 표적화되지 않은 대사체의 실험에서 대체되었을 때, 현저한 배치 효과가 나타날 수 있으며, 이는 대사체 정량화에 대한 주요 과제21,22,23이다. 현재 XCMS 24, Workflow4Metabolomic25, iMet-Q26 및 metaX19와 같은 소프트웨어는 표적화되지 않은 대사체의 피크 검출 및 정량을 수행 할 수 있지만 metaX의 파이프 라인이보다 완전하고 사용하기 쉽다는 것이 좋습니다. 여기에서는 XY-Meta를 사용하여 공개적으로 이용 가능한 데이터 세트 msv000084112에 대한 식별 및 FDR 제어 과정과 metaX를 사용한 대사 산물의 피크 검출 및 정량화를 시연합니다. 이 워크플로에는 두 개의 그룹만 필요하며 각 그룹에는 두 개 이상의 샘플이 필요합니다. MS/MS 스펙트럼 데이터는 질량 분광계 플랫폼, 이온화 모드, 전하 모드 및 샘플 유형에 관계없이 필요하며 샘플 기반 정규화 및 피크 기반 정규화를 지원할 수 있습니다. 이 예에 따라 연구자들은 다루기 쉬운 방법으로 대사체학 식별 및 정량화를 수행 할 수 있습니다. 이 파이프라인을 사용하려면 R 프로그래밍 기능이 필요합니다. 프로그래밍 지식없이 연구원을 돕기 위해 우리는 대사체 분석을위한 클라우드 분석 플랫폼도 개발했습니다. 우리는 보충 자료 5에서이 클라우드 분석 플랫폼을 시연했습니다.

Access restricted. Please log in or start a trial to view this content.

프로토콜

1. 분석을 위해 대사체학 데이터 세트 준비

참고: 이 데모에서는 QC 샘플 없이 대사체학 데이터 세트를 사용합니다. 케이스 및 제어 그룹에 대한 데이터가 필요합니다. 데모를 위해 GNPS 데이터베이스27에서 공용 데이터 세트를 사용합니다.

  1. 웹 페이지로 이동하 https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp. 데이터 집합 찾아보기를 클릭합니다.
  2. 제목 열에서 키워드 "msv000084112"를 검색합니다. 자세한 내용은 데이터 집합 ID 번호를 클릭하고 FTP를 사용하여 데이터 집합을 다운로드합니다.
  3. 원시 데이터를 /msv000084112 폴더에 넣습니다.
    참고: 이 데이터 세트는 Q Exactive 플랫폼의 C18 RP-UHPLC를 사용하여 포지티브 모드에서 획득했습니다. 소변 샘플의 대사에 특징이 없는 질병을 가진 코호트 데이터를 나타내며, 건강한 사람의 샘플 33개, 빈 샘플 12개, 환자 28명의 혼합 샘플 및 82개의 샘플을포함한다(보충 자료 8). 워크플로를 입증하기 위해 우리는 대조군으로 건강한 사람(NH)의 여섯 샘플을, 질병(NT)을 가진 여섯 개의 샘플을 사례 그룹으로 무작위로 선택하여 워크플로를 수행했습니다.

2. 데이터 형식 변환

참고: 데이터 세트가 질량 분광계에서 직접 생성된 원시 데이터인 경우 일반적으로 .raw, .wiff 또는 .cdf 형식입니다. mzXML 및 mgf 형식으로 변환해야합니다. 여기서는 ProteoWizard29 패키지의 msconvert 도구를 사용하여 형식 변환을 수행합니다.

  1. https://proteowizard.sourceforge.io/download.html 에서 ProteoWizard를 다운로드하여 설치하십시오.
  2. ProteoWizard 설치 경로에서 msconvert.exe를 사용하여 데이터 형식을 변환합니다.
    1. 원시 데이터를 mzXML 형식으로 변환하여 /mzXML 폴더에 저장합니다:/msconvert.exe /raw/*.raw -o /raw/mzXML/ --filter "peakPicking true [1,2]" --filter "zeroSamples removeExtra" --mzML --zlib --mz64 --filter "msLevel 1-2" --filter "titleMaker ... <차지 스테이트>".
    2. 원시 / mzXML 데이터를 mgf 형식으로 변환하고 /mgf 폴더에 저장하십시오 : / msconvert.exe /msv000084112 / *.raw -o /msv000084112 / mgf / --필터 "peakPicking true [1,2]"--filter "zeroSamples removeExtra"--mgf --mz64 --filter "msLevel 1-2"--filter "msLevel 1-2"--filter "titleMaker ... <차지 스테이트>".

3. 대사 산물에 대한 참조 스펙트럼 라이브러리 준비

참고: XY-meta는 참조 스펙트럼 라이브러리를 mgf 형식으로만 지원합니다.

  1. 웹 페이지 https://gnps.ucsd.edu/ProteoSAFe/libraries.jsp 로 이동합니다. 키워드 "NIST"를 검색하여 항목을 찾습니다. 보기를 클릭하여 자세한 내용을 확인하고 라이브러리를 다운로드합니다.
    참고: GNPS 공공 스펙트럼 라이브러리는 유형, 기원, 종 및 수집 모드로 배열된 많은 대사산물 라이브러리를 수집했습니다. 이러한 라이브러리의 일부만이 표준 재료를 사용하여 생성되지만 일반적으로 대부분의 기본 연구에 충분합니다.
  2. 다운로드한 라이브러리 GNPS-NIST14-MATCHES.mgf를 /database 폴더에 넣습니다.

4. 대사산물 확인 및 FDR 조절

  1. XY 메타(Windows 버전)를 다운로드합니다. /XY-Meta-Win/config/ 폴더 아래에서 매개 변수 구성 파일 parameter.default를 찾습니다. 보충 자료 1에 따라 내용을 변경하십시오.
    참고 : 해결책에서 대사 산물은 종종 음이온 또는 양이온으로 부가물을 형성하여 모 이온의 대량 이동을 유도합니다. 따라서 부가물의 유형을 설정해야합니다. 우리는 /adduct 폴더에서 양전하 모드 및 음전하 모드에서 이온 교환 컬럼 및 역방향 분석 컬럼에 대한 부가물 목록을 제공했습니다. 사용자는 또한 자신의 연구 프로젝트에 따라 자신의 부가물 목록을 편집 할 수 있습니다. 추가 목록은 제공된 목록과 동일한 형식이어야 합니다.
  2. XY-Meta:XY-Meta.exe -S /XY-Meta-Win/config/parameter.default -D /msv000084112/ pos_wt-1_a.mgf -R /database/GNPS-NIST14-MATCHES.mgf를 사용하여 대사산물 식별 및 FDR 제어를 수행합니다.
    참고: XY-Meta는 매개 변수에서 와일드카드를 지원하지 않습니다. 따라서 단일 명령을 사용하여 각 mgf 파일을 처리해야 합니다. 많은 수의 파일의 경우 배치 파일을 사용하는 것이 좋습니다.

5. 차등 분석

참고: metaX는 오픈 소스 R 패키지입니다. https://github.com/wenbostar/metaX 의 가이드에 따라 설치하십시오. 이 분석에는 8GB RAM이 필요합니다.

  1. sampleList.txt 파일을 편집하여 샘플 및 해당 MS 데이터를 지정합니다. 보충 자료 2를 참조하십시오.
    참고: metaX는 QC 샘플이 있는 데이터 세트에 대한 정량적 분석을 지원합니다. QC 샘플을 사용할 때 QC 샘플에 대한 클래스 속성을 NA로 수정하십시오.
  2. /output 폴더를 만들어 정량 분석 결과를 저장합니다. R을 사용하여 보충 자료 3 에서 스크립트를 실행하여 metaX를 사용하여 MOCK 및 WT 그룹을 정량화합니다.
    참고: 보충 자료 3에서 스크립트를 실행하기 전에 스크립트의 경로를 실제 로컬 경로로 수정하십시오.

6. 질적 및 양적 결과의 통합

  1. 보충 자료 4에서 R 스크립트를 실행하여 대사 산물 식별을 사용하여 정성 및 정량 분석에서 피크에 주석을 달으십시오.
    참고: 보충 자료 4에서 스크립트를 실행하기 전에 스크립트의 경로를 실제 로컬 경로로 수정하십시오.

Access restricted. Please log in or start a trial to view this content.

결과

msv000084112의 원시 데이터는 msconvert에 의해 변환되고.exe mgf 파일을 생성하였다(보충 자료 S6).

XY-메타는 /database 폴더 아래에 GNPS-NIST14-MATCHES_Decoy.mgf 파일을 생성했습니다. 이것은 원래의 참조 스펙트럼 라이브러리 GNPS-NIST14-MATCHES.mgf에서 생성 된 데코이 라이브러리입니다. 이 디코이 라이브러리는 재사용할 수 있습니다. 이 decoy 라이브러리를 다시 사용할 때 사용자는...

Access restricted. Please log in or start a trial to view this content.

토론

표적화되지 않은 대사 산물의 FDR 제어는 큰 도전이었습니다. 여기에서, 우리는 FDR 통제를 통한 대규모 비표적 대사체학 분석 (질적 및 양적)의 완전한 파이프 라인을 시연했습니다. 이것은 MS 분석에서 매우 일반적인 오탐을 효과적으로 줄입니다.

연구에 적합한 참조 스펙트럼 라이브러리를 준비하는 것이 핵심 포인트입니다. 성공적이고 민감한 MS/MS 식별을 위해서는 적절한 ?...

Access restricted. Please log in or start a trial to view this content.

공개

이해 상충이 없습니다.

감사의 말

이 작업은 국가 핵심 연구 개발 프로그램 (2018YFC0910200 / 2017YFA0505001)과 광동 키 R & D 프로그램 (2019B020226001)의 지원을 받습니다.

Access restricted. Please log in or start a trial to view this content.

자료

NameCompanyCatalog NumberComments
GNPSopen sourcen/ahttps://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp
XY-Metaopen sourcen/ahttps://github.com/DLI-ShenZhen/XY-Meta
metaXopen sourcen/ahttps://github.com/wenbostar/metaX
ProteoWizardFree Download3.0.22116.18c918b-x86_64https://proteowizard.sourceforge.io/download.html
CHI.ClientFree Downloadndp48-x86-x64-allos-enuhttp://www.chi-biotech.com/technology.html?ty=ypt

참고문헌

  1. Misra, B. B., Fahrmann, J. F., Grapov, D. Review of emerging metabolomic tools and resources: 2015-2016. Electrophoresis. 38 (18), 2257-2274 (2017).
  2. Idle, J. R., Gonzalez, F. J. Metabolomics. Cell Metabolism. 6 (5), 348-351 (2007).
  3. Fiehn, O. Metabolomics — the link between genotypes and phenotypes. Functional Genomics. Town, C. , Springer. Netherlands. Dordrecht. 155-171 (2002).
  4. Functional Genomics. Town, C. , Springer. Netherlands. Dordrecht. (2002).
  5. Dettmer, K., Aronov, P. A., Hammock, B. D. Mass spectrometry-based metabolomics. Mass Spectrometry Reviews. 26 (1), 51-78 (2007).
  6. Vinayavekhin, N., Saghatelian, A. Untargeted metabolomics. Current Protocols in Molecular Biology. , Chapter 30, Unit 30.1 1-24 (2010).
  7. Chaleckis, R., Meister, I., Zhang, P., Wheelock, C. E. Challenges, progress and promises of metabolite annotation for LC-MS-based metabolomics. Current Opinion in Biotechnology. 55, 44-50 (2019).
  8. Palmer, A., et al. FDR-controlled metabolite annotation for high-resolution imaging mass spectrometry. Nature Methods. 14 (1), 57-60 (2017).
  9. Scheubert, K., et al. Significance estimation for large scale metabolomics annotations by spectral matching. Nature Communications. 8 (1), 1494(2017).
  10. Schrimpe-Rutledge, A. C., Codreanu, S. G., Sherrod, S. D., McLean, J. A. Untargeted metabolomics strategies-challenges and emerging directions. Journal of the American Society for Mass Spectrometry. 27 (12), 1897-1905 (2016).
  11. Blaženović, I., Kind, T., Ji, J., Fiehn, O. Software tools and approaches for compound identification of LC-MS/MS data in metabolomics. Metabolites. 8 (2), (2018).
  12. Katajamaa, M., Miettinen, J., Oresic, M. MZmine: toolbox for processing and visualization of mass spectrometry based molecular profile data. Bioinformatics. 22 (5), Oxford, England. 634-636 (2006).
  13. Tsugawa, H., et al. Hydrogen rearrangement rules: computational MS/MS fragmentation and structure elucidation using MS-FINDER software. Analytical chemistry. 88 (16), 7946-7958 (2016).
  14. Wang, F., et al. CFM-ID 4.0: More accurate ESI-MS/MS spectral prediction and compound identification. Analytical Chemistry. 93 (34), 11692-11700 (2021).
  15. Ruttkies, C., Schymanski, E. L., Wolf, S., Hollender, J., Neumann, S. MetFrag relaunched: incorporating strategies beyond in silico fragmentation. Journal of Cheminformatics. 8, 3(2016).
  16. Delabriere, A., Warmer, P., Brennsteiner, V., Zamboni, N. SLAW: A scalable and self-optimizing processing workflow for untargeted LC-MS. Analytical chemistry. 93 (45), 15024-15032 (2021).
  17. Wang, X., et al. Target-decoy-based false discovery rate estimation for large-scale metabolite identification. Journal of Proteome Research. 17 (7), 2328-2334 (2018).
  18. Li, D., et al. XY-Meta: a high-efficiency search engine for large-scale metabolome annotation with accurate FDR estimation. Analytical Chemistry. 92 (8), 5701-5707 (2020).
  19. Wen, B., Mei, Z., Zeng, C., Liu, S. metaX: a flexible and comprehensive software for processing metabolomics data. BMC Bioinformatics. 18 (1), 183(2017).
  20. Aberg, K. M., Torgrip, R. J. O., Kolmert, J., Schuppe-Koistinen, I., Lindberg, J. Feature detection and alignment of hyphenated chromatographic-mass spectrometric data. Extraction of pure ion chromatograms using Kalman tracking. Journal of Chromatography. A. 1192 (1), 139-146 (2008).
  21. Liu, Q., et al. Addressing the batch effect issue for LC/MS metabolomics data in data preprocessing. Scientific Reports. 10 (1), 13856(2020).
  22. Han, W., Li, L. Evaluating and minimizing batch effects in metabolomics. Mass Spectrometry Reviews. 41 (3), 421-442 (2022).
  23. Fei, F., Bowdish, D. M. E., McCarry, B. E. Comprehensive and simultaneous coverage of lipid and polar metabolites for endogenous cellular metabolomics using HILIC-TOF-MS. Analytical and Bioanalytical Chemistry. 406 (15), 3723-3733 (2014).
  24. Smith, C. A., Want, E. J., O'Maille, G., Abagyan, R., Siuzdak, G. XCMS: processing mass spectrometry data for metabolite profiling using nonlinear peak alignment, matching, and identification. Analytical Chemistry. 78 (3), 779-787 (2006).
  25. Giacomoni, F., et al. Workflow4Metabolomics: a collaborative research infrastructure for computational metabolomics. Bioinformatics. 31 (9), Oxford, England. 1493-1495 (2015).
  26. Chang, H. -Y., et al. iMet-Q: A user-friendly tool for label-free metabolomics quantitation using dynamic peak-width determination. PloS One. 11 (1), 0146112(2016).
  27. Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
  28. Schmid, R., et al. Ion identity molecular networking for mass spectrometry-based metabolomics in the GNPS environment. Nature Communications. 12 (1), 3832(2021).
  29. Kessner, D., Chambers, M., Burke, R., Agus, D., Mallick, P. ProteoWizard: open source software for rapid proteomics tools development. Bioinformatics. 24 (21), Oxford, England. 2534-2536 (2008).
  30. Johnson, S. R., Lange, B. M. Open-access metabolomics databases for natural product research: present capabilities and future potential. Frontiers in Bioengineering and Biotechnology. 3, 22(2015).
  31. Horai, H., et al. MassBank: a public repository for sharing mass spectral data for life sciences. Journal of Mass Spectrometry: JMS. 45 (7), 703-714 (2010).
  32. Rawlinson, C., et al. Hierarchical clustering of MS/MS spectra from the firefly metabolome identifies new lucibufagin compounds. Scientific Reports. 10 (1), 6043(2020).

Access restricted. Please log in or start a trial to view this content.

재인쇄 및 허가

JoVE'article의 텍스트 или 그림을 다시 사용하시려면 허가 살펴보기

허가 살펴보기

더 많은 기사 탐색

187

This article has been published

Video Coming Soon

JoVE Logo

개인 정보 보호

이용 약관

정책

연구

교육

JoVE 소개

Copyright © 2025 MyJoVE Corporation. 판권 소유