JoVE Logo

Войдите в систему

Для просмотра этого контента требуется подписка на Jove Войдите в систему или начните бесплатную пробную версию.

В этой статье

  • Резюме
  • Аннотация
  • Введение
  • протокол
  • Результаты
  • Обсуждение
  • Раскрытие информации
  • Благодарности
  • Материалы
  • Ссылки
  • Перепечатки и разрешения

Резюме

Мы построили нецелевой метаболомический рабочий процесс, который объединил XY-Meta и metaX вместе. В этом протоколе мы показали, как использовать XY-Meta для генерации спектральной библиотеки приманки из ссылки на спектры открытого доступа, а затем выполнили управление FDR и использовали metaX для количественного определения метаболитов после идентификации спектров метаболомики.

Аннотация

Методы нецелевой метаболомики широко используются в последние годы. Однако быстро растущая пропускная способность и количество образцов создают огромное количество спектров, создавая проблемы для контроля качества спектров масс-спектрометрии. Чтобы уменьшить количество ложных срабатываний, необходим контроль качества частоты ложных обнаружений (FDR). Недавно мы разработали программное обеспечение для контроля FDR нецелевой идентификации метаболомов, которое основано на стратегии Target-Decoy под названием XY-Meta. Здесь мы продемонстрировали полный конвейер анализа, который объединяет XY-Meta и metaX вместе. Этот протокол показывает, как использовать XY-meta для создания базы данных приманки из существующей справочной базы данных и выполнения управления FDR с использованием стратегии Target-Decoy для крупномасштабной идентификации метаболомов в наборе данных с открытым доступом. Дифференциальный анализ и аннотацию метаболитов проводили после запуска metaX для обнаружения и количественного определения пиков метаболитов. Чтобы помочь большему количеству исследователей, мы также разработали удобную облачную аналитическую платформу для этих анализов, без необходимости в навыках биоинформатики или каких-либо компьютерных языках.

Введение

Метаболиты играют важную роль в биологических процессах. Метаболиты часто являются регуляторами различных процессов, таких как передача энергии, гормональные регуляции, регуляция нейротрансмиттеров, клеточная связь и посттрансляционные модификации белка и т. Д. 1,2,3,4. Нецелевая метаболомика дает глобальное представление о многочисленных метаболитах 5,6. С достижениями в области технологий масс-спектрометрии и хроматографии пропускная способность спектров метаболома MS / MS быстро увеличивается в последниегоды 7,8,9,10,11. Для идентификации метаболитов из этих огромных наборов данных было разработано различное программное обеспечение для аннотаций11, такое как MZmine12, MS-FINDER13, CFM-ID14, MetFrag15 и SLAW16. Однако эти идентификации часто содержат много ложных срабатываний. Причины включают в себя: (1) Спектры MS / MS содержат случайный шум, который может ввести в заблуждение пиковое соответствие. (2) Изомеры и различия в энергиях фрагментации вызывают множественные спектры отпечатков пальцев и, таким образом, увеличивают объем справочной библиотеки. (3) Качество справочных библиотек варьируется. Необходим надлежащий стандарт для создания хорошей справочной спектральной библиотеки. Таким образом, систематический контроль уровня ложных обнаружений (FDR) для нецелевой метаболомики имеет важное значение для исследования функционального метаболома 7,8,9,17.

Как эмпирический подход Байеса, так и стратегия Target-Decoy решали проблему контроля Рузвельта в целом. Kerstin Scheubert et al. показали, что стратегия Target-Decoy на базе данных приманок, сгенерированная методом фрагментации на основе дерева, является лучшим методом для контроля FDR9. Xusheng Wang et al. разработали метод генерации приманки, основанный на правиле октета в химии, и улучшили точность оценки Рузвельта17. Спектральная библиотека для генерации базы данных приманок была продемонстрирована для повышения производительности18. Здесь мы улучшили метод на основе спектральной библиотеки и разработали программное обеспечение под названием XY-Meta19 , которое может еще больше повысить точность оценки FDR. Он использует существующую справочную спектральную библиотеку для создания библиотеки приманок для управления FDR по схеме Target-Decoy. XY-Meta поддерживает собственные алгоритмы сопоставления спектров и косинуса. Он позволяет использовать обычные режимы поиска и итеративного поиска. На этапе оценки FDR он поддерживает сцепленный режим Target-Decoy и раздельный режим. Для большей гибкости XY-Meta принимает внешние библиотеки приманок.

Обнаружение пиков и количественная оценка метаболитов также является важным этапом нецелевого анализа метаболомов. Обнаружение пика является основным методом идентификации метаболомов. В целом, на точность пикового обнаружения метаболитов влияли многочисленные факторы, такие как шумовые сигналы масс-спектрометрии, низкое содержание метаболитов, загрязняющих веществ и продукты деградации метаболитов20. Когда количество образцов слишком велико или колонка жидкостной хроматографии была заменена в экспериментах с нецелевым метаболомом, могут появиться замечательные эффекты партии, что является серьезной проблемой для количественного определения метаболома 21,22,23. В настоящее время такие программы, как XCMS24, Workflow4Metabolomic25, iMet-Q26 и metaX19, могут выполнять обнаружение пиков и количественное определение нецелевого метаболома, но мы предполагаем, что конвейер metaX более полный и простой в использовании. Здесь мы демонстрируем процесс идентификации и контроля FDR для общедоступного набора данных msv000084112 с использованием XY-Meta, а также обнаружение пиков и количественную оценку метаболитов с помощью metaX. Для этого рабочего процесса требуется только две группы, и каждой группе требуется не менее двух образцов. Данные спектров MS/MS необходимы независимо от платформы масс-спектрометра, режима ионизации, режима заряда и типа образца и могут поддерживать нормализацию на основе образцов и нормализацию на основе пиков. Следуя этому примеру, исследователи могут выполнить идентификацию и количественную оценку метаболомики простым в обращении способом. Для использования этого конвейера требуется возможность программирования R. Чтобы помочь исследователю без каких-либо знаний в области программирования, мы также разработали платформу облачного анализа для анализа метаболомики. Мы продемонстрировали эту платформу облачного анализа в Дополнительном материале 5.

Access restricted. Please log in or start a trial to view this content.

протокол

1. Подготовка наборов данных метаболомики для анализа

ПРИМЕЧАНИЕ: В этой демонстрации мы используем наборы данных метаболомики без образца QC. Необходимы данные для групп кейсов и контрольных групп. Для демонстрации мы используем общедоступный набор данных в базе данных GNPS27.

  1. Перейдите на веб-страницу https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp. Нажмите кнопку Обзор наборов данных.
  2. Выполните поиск по ключевому слову "msv000084112" в столбце Заголовок . Щелкните идентификационный номер набора данных для получения подробных сведений и загрузите набор данных с помощью FTP.
  3. Поместите необработанные данные в папку /msv000084112.
    ПРИМЕЧАНИЕ: Этот набор данных был получен с использованием C18 RP-UHPLC на платформе Q Exactive в положительном режиме. Он представляет собой когорту с нехарактеризованным заболеванием метаболизма образцов мочи, включая 33 образца здоровых людей, 12 пустых образцов, два образца смешивания и 82 образца пациентов28 (Дополнительный материал 8). Чтобы продемонстрировать рабочий процесс, мы случайным образом выбрали шесть образцов здоровых людей (NH) в качестве контрольной группы и шесть образцов с заболеванием (NT) в качестве группы случаев для выполнения рабочего процесса.

2. Преобразование формата данных

ПРИМЕЧАНИЕ: Если набор данных представляет собой необработанные данные, сгенерированные непосредственно с масс-спектрометра, он обычно находится в формате .raw, .wiff или .cdf. Они должны быть преобразованы в форматы mzXML и mgf. Здесь мы используем инструмент msconvert в пакете ProteoWizard29 для преобразования формата.

  1. Загрузите ProteoWizard с https://proteowizard.sourceforge.io/download.html и установите его.
  2. Преобразуйте формат данных с помощью msconvert.exe в пути установки ProteoWizard.
    1. Преобразуйте необработанные данные в формат mzXML и сохраните их в папке /mzXML:/msconvert.exe /raw/*.raw -o /raw/mzXML/ --filter "peakPicking true [1,2]" --filter "zeroSamples removeExtra" --mzML --zlib --mz64 --filter "msLevel 1-2" --filter "titleMaker ... <Зарядное государство>».
    2. Преобразуйте данные raw/mzXML в формат mgf и сохраните их в папке /mgf:/msconvert.exe /msv000084112/*.raw -o /msv000084112/mgf/ --filter "peakPicking true [1,2]" --filter "zeroSamples removeExtra" --mgf --mz64 --filter "msLevel 1-2" --filter "titleMaker ... <Зарядное государство>».

3. Подготовьте справочную спектральную библиотеку для метаболитов

ПРИМЕЧАНИЕ: XY-meta поддерживает справочные спектральные библиотеки только в формате mgf.

  1. Перейдите на веб-страницу https://gnps.ucsd.edu/ProteoSAFe/libraries.jsp. Выполните поиск по ключевому слову "NIST", чтобы найти товар. Нажмите кнопку Просмотр для получения подробных сведений и загрузите библиотеку.
    ПРИМЕЧАНИЕ: Публичные спектральные библиотеки GNPS собрали множество библиотек метаболитов, упорядоченных по типу, происхождению, видам и режимам сбора. Хотя только небольшая часть этих библиотек генерируется с использованием стандартных материалов, их обычно достаточно для большинства фундаментальных исследований.
  2. Поместите загруженную библиотеку GNPS-NIST14-MATCHES.mgf в папку /database.

4. Идентификация метаболитов и контроль FDR

  1. Загрузите XY-meta (версия для Windows). Найдите файл конфигурации параметра parameter.default в папке /XY-Meta-Win/config/. Изменить его содержание в соответствии с Дополнительным материалом 1.
    ПРИМЕЧАНИЕ: В растворе метаболиты часто образуют аддукты с анионами или катионами, что приводит к массовому смещению родительских ионов. Поэтому необходимо задавать типы аддуктов. Мы предоставили списки adduct для столбцов ионного обмена и обратных аналитических столбцов в режиме положительного заряда и в режиме отрицательного заряда в папке /adduct. Пользователи также могут редактировать свой собственный список объявлений в соответствии со своим исследовательским проектом. Список объявлений должен быть в том же формате, что и предоставленный список.
  2. Выполните идентификацию метаболитов и управление FDR с помощью XY-Meta:XY-Meta.exe -S /XY-Meta-Win/config/parameter.default -D /msv000084112/ pos_wt-1_a.mgf -R /database/GNPS-NIST14-MATCHES.mgf.
    ПРИМЕЧАНИЕ: XY-Meta не поддерживает подстановочные знаки в параметрах. Поэтому для обработки каждого mgf-файла следует использовать одну команду. Для большого количества файлов рекомендуется использовать пакетный файл.

5. Дифференциальный анализ

ПРИМЕЧАНИЕ: metaX является пакетом R с открытым исходным кодом. Пожалуйста, установите его в соответствии с руководством по https://github.com/wenbostar/metaX. Для этого анализа требуется 8 ГБ оперативной памяти.

  1. Отредактируйте файл sampleList.txt чтобы указать образец и соответствующие ему данные MS. Пожалуйста, обратитесь к Дополнительному материалу 2.
    ПРИМЕЧАНИЕ: metaX поддерживает количественный анализ наборов данных с выборками QC. При использовании образцов контроля качества измените свойство класса на NA для образцов контроля качества.
  2. Создайте папку /output для хранения результатов количественного анализа. Используйте R для запуска сценария в Дополнительном материале 3 , чтобы использовать metaX для количественной оценки групп MOCK и WT.
    ПРИМЕЧАНИЕ: Перед запуском скрипта в дополнительном материале 3 измените пути в скрипте на фактические локальные пути.

6. Интеграция качественных и количественных результатов

  1. Запустите скрипт R в дополнительном материале 4 , чтобы аннотировать пики в качественном и количественном анализе с использованием идентификации метаболитов.
    ПРИМЕЧАНИЕ: Перед запуском скрипта в Дополнительном материале 4, пожалуйста, измените пути в скрипте на ваши фактические локальные пути.

Access restricted. Please log in or start a trial to view this content.

Результаты

Необработанные данные msv000084112 были преобразованы msconvert.exe и сгенерированы mgf файлы (Дополнительный материал S6).

XY-Meta сгенерировал файл GNPS-NIST14-MATCHES_Decoy.mgf в папке /database. Это библиотека приманок, сгенерированная из оригинальной справочной спектральной библиотеки GNPS-NIS...

Access restricted. Please log in or start a trial to view this content.

Обсуждение

Контроль FDR над нецелевыми метаболитами был большой проблемой. Здесь мы продемонстрировали полный конвейер крупномасштабного нецелевого метаболомического анализа (качественного и количественного) с контролем FDR. Это эффективно снижает ложные срабатывания, которые очень распростран?...

Access restricted. Please log in or start a trial to view this content.

Раскрытие информации

Отсутствие конфликта интересов.

Благодарности

Эта работа поддерживается Национальной программой ключевых исследований и разработок (2018YFC0910200/2017YFA0505001) и Программой исследований и разработок Guangdong Key (2019B020226001).

Access restricted. Please log in or start a trial to view this content.

Материалы

NameCompanyCatalog NumberComments
GNPSopen sourcen/ahttps://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp
XY-Metaopen sourcen/ahttps://github.com/DLI-ShenZhen/XY-Meta
metaXopen sourcen/ahttps://github.com/wenbostar/metaX
ProteoWizardFree Download3.0.22116.18c918b-x86_64https://proteowizard.sourceforge.io/download.html
CHI.ClientFree Downloadndp48-x86-x64-allos-enuhttp://www.chi-biotech.com/technology.html?ty=ypt

Ссылки

  1. Misra, B. B., Fahrmann, J. F., Grapov, D. Review of emerging metabolomic tools and resources: 2015-2016. Electrophoresis. 38 (18), 2257-2274 (2017).
  2. Idle, J. R., Gonzalez, F. J. Metabolomics. Cell Metabolism. 6 (5), 348-351 (2007).
  3. Fiehn, O. Metabolomics — the link between genotypes and phenotypes. Functional Genomics. Town, C. , Springer. Netherlands. Dordrecht. 155-171 (2002).
  4. Functional Genomics. Town, C. , Springer. Netherlands. Dordrecht. (2002).
  5. Dettmer, K., Aronov, P. A., Hammock, B. D. Mass spectrometry-based metabolomics. Mass Spectrometry Reviews. 26 (1), 51-78 (2007).
  6. Vinayavekhin, N., Saghatelian, A. Untargeted metabolomics. Current Protocols in Molecular Biology. , Chapter 30, Unit 30.1 1-24 (2010).
  7. Chaleckis, R., Meister, I., Zhang, P., Wheelock, C. E. Challenges, progress and promises of metabolite annotation for LC-MS-based metabolomics. Current Opinion in Biotechnology. 55, 44-50 (2019).
  8. Palmer, A., et al. FDR-controlled metabolite annotation for high-resolution imaging mass spectrometry. Nature Methods. 14 (1), 57-60 (2017).
  9. Scheubert, K., et al. Significance estimation for large scale metabolomics annotations by spectral matching. Nature Communications. 8 (1), 1494(2017).
  10. Schrimpe-Rutledge, A. C., Codreanu, S. G., Sherrod, S. D., McLean, J. A. Untargeted metabolomics strategies-challenges and emerging directions. Journal of the American Society for Mass Spectrometry. 27 (12), 1897-1905 (2016).
  11. Blaženović, I., Kind, T., Ji, J., Fiehn, O. Software tools and approaches for compound identification of LC-MS/MS data in metabolomics. Metabolites. 8 (2), (2018).
  12. Katajamaa, M., Miettinen, J., Oresic, M. MZmine: toolbox for processing and visualization of mass spectrometry based molecular profile data. Bioinformatics. 22 (5), Oxford, England. 634-636 (2006).
  13. Tsugawa, H., et al. Hydrogen rearrangement rules: computational MS/MS fragmentation and structure elucidation using MS-FINDER software. Analytical chemistry. 88 (16), 7946-7958 (2016).
  14. Wang, F., et al. CFM-ID 4.0: More accurate ESI-MS/MS spectral prediction and compound identification. Analytical Chemistry. 93 (34), 11692-11700 (2021).
  15. Ruttkies, C., Schymanski, E. L., Wolf, S., Hollender, J., Neumann, S. MetFrag relaunched: incorporating strategies beyond in silico fragmentation. Journal of Cheminformatics. 8, 3(2016).
  16. Delabriere, A., Warmer, P., Brennsteiner, V., Zamboni, N. SLAW: A scalable and self-optimizing processing workflow for untargeted LC-MS. Analytical chemistry. 93 (45), 15024-15032 (2021).
  17. Wang, X., et al. Target-decoy-based false discovery rate estimation for large-scale metabolite identification. Journal of Proteome Research. 17 (7), 2328-2334 (2018).
  18. Li, D., et al. XY-Meta: a high-efficiency search engine for large-scale metabolome annotation with accurate FDR estimation. Analytical Chemistry. 92 (8), 5701-5707 (2020).
  19. Wen, B., Mei, Z., Zeng, C., Liu, S. metaX: a flexible and comprehensive software for processing metabolomics data. BMC Bioinformatics. 18 (1), 183(2017).
  20. Aberg, K. M., Torgrip, R. J. O., Kolmert, J., Schuppe-Koistinen, I., Lindberg, J. Feature detection and alignment of hyphenated chromatographic-mass spectrometric data. Extraction of pure ion chromatograms using Kalman tracking. Journal of Chromatography. A. 1192 (1), 139-146 (2008).
  21. Liu, Q., et al. Addressing the batch effect issue for LC/MS metabolomics data in data preprocessing. Scientific Reports. 10 (1), 13856(2020).
  22. Han, W., Li, L. Evaluating and minimizing batch effects in metabolomics. Mass Spectrometry Reviews. 41 (3), 421-442 (2022).
  23. Fei, F., Bowdish, D. M. E., McCarry, B. E. Comprehensive and simultaneous coverage of lipid and polar metabolites for endogenous cellular metabolomics using HILIC-TOF-MS. Analytical and Bioanalytical Chemistry. 406 (15), 3723-3733 (2014).
  24. Smith, C. A., Want, E. J., O'Maille, G., Abagyan, R., Siuzdak, G. XCMS: processing mass spectrometry data for metabolite profiling using nonlinear peak alignment, matching, and identification. Analytical Chemistry. 78 (3), 779-787 (2006).
  25. Giacomoni, F., et al. Workflow4Metabolomics: a collaborative research infrastructure for computational metabolomics. Bioinformatics. 31 (9), Oxford, England. 1493-1495 (2015).
  26. Chang, H. -Y., et al. iMet-Q: A user-friendly tool for label-free metabolomics quantitation using dynamic peak-width determination. PloS One. 11 (1), 0146112(2016).
  27. Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
  28. Schmid, R., et al. Ion identity molecular networking for mass spectrometry-based metabolomics in the GNPS environment. Nature Communications. 12 (1), 3832(2021).
  29. Kessner, D., Chambers, M., Burke, R., Agus, D., Mallick, P. ProteoWizard: open source software for rapid proteomics tools development. Bioinformatics. 24 (21), Oxford, England. 2534-2536 (2008).
  30. Johnson, S. R., Lange, B. M. Open-access metabolomics databases for natural product research: present capabilities and future potential. Frontiers in Bioengineering and Biotechnology. 3, 22(2015).
  31. Horai, H., et al. MassBank: a public repository for sharing mass spectral data for life sciences. Journal of Mass Spectrometry: JMS. 45 (7), 703-714 (2010).
  32. Rawlinson, C., et al. Hierarchical clustering of MS/MS spectra from the firefly metabolome identifies new lucibufagin compounds. Scientific Reports. 10 (1), 6043(2020).

Access restricted. Please log in or start a trial to view this content.

Перепечатки и разрешения

Запросить разрешение на использование текста или рисунков этого JoVE статьи

Запросить разрешение

Смотреть дополнительные статьи

187

This article has been published

Video Coming Soon

JoVE Logo

Исследования

Образование

О JoVE

Авторские права © 2025 MyJoVE Corporation. Все права защищены