JoVE Logo

Entrar

É necessária uma assinatura da JoVE para visualizar este conteúdo. Faça login ou comece sua avaliação gratuita.

Neste Artigo

  • Resumo
  • Resumo
  • Introdução
  • Protocolo
  • Resultados
  • Discussão
  • Divulgações
  • Agradecimentos
  • Materiais
  • Referências
  • Reimpressões e Permissões

Resumo

Construímos um fluxo de trabalho metabolômico não-acompanhado que integrou XY-Meta e metaX juntos. Neste protocolo, exibimos como usar o XY-Meta para gerar uma biblioteca espectral chamariz a partir da referência de espectro de acesso aberto e, em seguida, executamos o controle FDR e usamos o metaX para quantificar os metabólitos depois de identificar o espectro metabolômico.

Resumo

Técnicas de metabolômica não-alvo estão sendo amplamente utilizadas nos últimos anos. No entanto, o rápido aumento do rendimento e o número de amostras criam uma enorme quantidade de espectros, estabelecendo desafios para o controle de qualidade do espectrometria de massa. Para reduzir os falsos positivos, é necessário um controle de qualidade da taxa de descoberta falsa (FDR). Recentemente, desenvolvemos um software para controle FDR de identificação metabolome não direcionada que é baseado em uma estratégia de isca alvo chamada XY-Meta. Aqui, demonstramos um pipeline de análise completo que integra XY-Meta e metaX juntos. Este protocolo mostra como usar o XY-meta para gerar um banco de dados de isca a partir de um banco de dados de referência existente e executar o controle FDR usando a estratégia Target-Decoy para identificação metabolome em larga escala em um conjunto de dados de acesso aberto. A análise diferencial e a anotação dos metabólitos foram realizadas após a execução do metaX para picos metabólitos de detecção e quantitação. Para ajudar mais pesquisadores, também desenvolvemos uma plataforma de análise baseada em nuvem para essas análises, sem a necessidade de habilidades bioinformáticas ou qualquer linguagem de computador.

Introdução

Os metabólitos desempenham papéis importantes nos processos biológicos. Metabólitos são frequentemente reguladores de vários processos como transferência de energia, regulamentos hormonais, regulação de neurotransmissores, comunicações celulares e modificações pós-translacionais de proteínas, etc 1,2,3,4. Metabolômica não-alvo fornece uma visão global de numerosos metabólitos 5,6. Com os avanços nas tecnologias de espectrometria de massa e cromatografia, o rendimento dos espectros metabolome MS/MS está aumentando rapidamente nos últimos anos 7,8,9,10,11. Para identificar metabólitos desses enormes conjuntos de dados, vários softwares de anotação foram desenvolvidos11, como MZmine12, MS-FINDER13, CFM-ID14, MetFrag15 e SLAW16. No entanto, essas identificações muitas vezes contêm muitos falsos positivos. As razões incluem: (1) Os espectros MS/MS contêm ruído aleatório, o que pode enganar a correspondência de pico. (2) Isômeros e diferenças nas energias de fragmentação causam múltiplas impressões digitais de espectro e, assim, aumentam o volume da biblioteca de referência. (3) A qualidade das bibliotecas de referência varia. É necessário um padrão adequado para construir uma boa biblioteca espectral de referência. Portanto, um controle sistemático de falsas taxas de descoberta (FDR) para metabolômica não-alvo é essencial para a pesquisa de metabolome funcional 7,8,9,17.

Tanto a abordagem empírica de Bayes quanto a estratégia target-decoy resolveram o problema de controle FDR em geral. Kerstin Scheubert et al. mostraram que a estratégia target-decoy no banco de dados de isca gerada a partir do método baseado em árvores de fragmentação é o melhor método para o controle FDR9. Xusheng Wang et al. projetaram um método para a geração de isca com base na regra do octeto em química e melhoraram a precisão da estimativa de FDR17. A biblioteca espectral para geração de banco de dados de isca foi demonstrada para melhor desempenho18. Aqui, melhoramos o método baseado em biblioteca espectral e desenvolvemos um software chamado XY-Meta19 que pode melhorar ainda mais a precisão da estimativa do FDR. Ele usa a biblioteca espectral de referência existente para gerar uma biblioteca de isca para o controle FDR sob o esquema Target-Decoy. XY-Meta suporta seus próprios algoritmos de correspondência de espectros e similaridade cossino. Permite modos convencionais de pesquisa e pesquisa iterativa. Na etapa de avaliação do FDR, ele suporta o modo concateado Target-Decoy e o modo separado. Para uma melhor flexibilidade, o XY-Meta aceita bibliotecas de isca externas.

A detecção e quantificação de picos de metabólitos também é um passo importante da análise metabolome não alvo. A detecção de picos é o principal método de identificação metabolome. Em geral, a precisão da detecção de pico de metabólitos foi afetada por múltiplos fatores, como sinais sonoros de espectrometria de massa, baixa abundância de metabólitos, contaminantes e produtos de degradação de metabólitos20. Quando o número de amostras é muito grande ou a coluna de cromatografia líquida foi substituída em experimentos de metabolome não-alvo, podem aparecer efeitos notáveis em lote, o que é um grande desafio para a quantitação metabolome 21,22,23. Atualmente, softwares como XCMS24, Workflow4Metabolomic25, iMet-Q26 e metaX19 podem realizar detecção de pico e quantitação de metabolome não-alvo, mas sugerimos que o pipeline de metaX é mais completo e fácil de usar. Aqui, demonstramos o processo de identificação e controle de FDR para um conjunto de dados disponível publicamente msv000084112 usando XY-Meta, e o pico de detecção e quantificação de metabólitos usando metaX. Este fluxo de trabalho requer apenas dois grupos, e cada grupo precisa de pelo menos duas amostras. Os dados de espectro de MS/MS são necessários, independentemente da plataforma de espectrômetro de massa, modo de ionização, modo de carga e tipo de amostra, e podem suportar a normalização baseada em amostras e a normalização baseada em picos. Seguindo este exemplo, os pesquisadores podem realizar a identificação e quantificação metabolômica de forma fácil de lidar. O uso deste pipeline requer capacidade de programação R. Para ajudar o pesquisador sem qualquer conhecimento de programação, também desenvolvemos uma plataforma de análise em nuvem para análise metabolômica. Demonstramos essa plataforma de análise de nuvem em Material Suplementar 5.

Access restricted. Please log in or start a trial to view this content.

Protocolo

1. Prepare os conjuntos de dados metabolômicos para análise

NOTA: Nesta demonstração, usamos conjuntos de dados metabolômicos sem amostra de QC. São necessários dados para grupos de casos e controle. Para demonstração, usamos um conjunto de dados público no banco de dados GNPS27.

  1. Vá para a página https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp. Clique em Procurar Conjuntos de dados.
  2. Pesquise a palavra-chave "msv000084112" na coluna Título . Clique no número de identificação do conjunto de dados para obter detalhes e baixe o conjunto de dados usando FTP.
  3. Coloque os dados brutos na pasta /msv000084112.
    NOTA: Este conjunto de dados foi adquirido usando C18 RP-UHPLC na plataforma Q Exactive no modo positivo. Representa uma coorte com uma doença não caracterizada do metabolismo de dados de amostras de urina, incluindo 33 amostras de pessoas saudáveis, 12 amostras em branco, duas amostras de mistura e 82 amostras de pacientes28 (Material Suplementar 8). Para demonstrar o fluxo de trabalho, escolhemos aleatoriamente seis amostras de pessoas saudáveis (NH) como grupo controle e seis amostras com a doença (NT) como um grupo de casos para realizar o fluxo de trabalho.

2. Conversão de formato de dados

NOTA: Se o conjunto de dados é o dados bruto gerados diretamente do espectrômetro de massa, geralmente está no formato .raw, .wiff ou .cdf. Eles devem ser convertidos em formatos mzXML e mgf. Aqui, usamos a ferramenta msconvert no pacote ProteoWizard29 para fazer a conversão de formato.

  1. Baixe o ProteoWizard de https://proteowizard.sourceforge.io/download.html e instale-o.
  2. Converta o formato de dados usando msconvert.exe sob o caminho de instalação ProteoWizard.
    1. Converta os dados brutos em formato mzXML e armazene-os em /mzXML folder:/msconvert.exe /raw/*.raw -o /raw/mzXML/ --filter "peakPicking true [1,2]" -filtro "zeroSamples removeExtra " -mzML --zlib --mz64 --filtro "msLevel 1-2" --filtro "titleMaker ... ".
    2. Converta os dados bruto/mzXML em formato mgf e armazene-os em /mgf folder:/msconvert.exe /msv000084112/*.raw -o /msv000084112/mgf/ --filter "peakPicking true [1,2 ]" -Filtro "zeroSamples removeExtra" --mgf --mz64 --filtro "msLevel 1-2" --filtro "titleMaker ... ".

3. Prepare a biblioteca espectral de referência para os metabólitos

NOTA: XY-meta suporta as bibliotecas espectrais de referência apenas no formato mgf.

  1. Vá para a página https://gnps.ucsd.edu/ProteoSAFe/libraries.jsp. Pesquise a palavra-chave "NIST" para encontrar o item. Clique em Exibir para obter os detalhes e baixe a biblioteca.
    NOTA: As Bibliotecas Espectrais Públicas do GNPS coletaram muitas bibliotecas metabólicas, dispostas em modos de tipo, origem, espécies e coleta. Embora apenas uma pequena fração dessas bibliotecas sejam geradas usando materiais padrão, elas geralmente são suficientes para a pesquisa mais fundamental.
  2. Coloque a biblioteca baixada GNPS-NIST14-MATCHES.mgf na pasta /banco de dados.

4. Identificação de metabólitos e controle de FDR

  1. Baixe o XY-meta (versão do Windows). Encontre o parâmetro de configuração do parâmetro de configuração.padrão na pasta /XY-Meta-Win/config/. Alterar seu conteúdo de acordo com Material Suplementar 1.
    NOTA: Na solução, metabólitos frequentemente formam adutos com ânions ou ânations, o que leva a uma mudança em massa de íons-mãe. Portanto, é necessário definir os tipos de adutos. Fornecemos listas de adutos para coluna de troca de íons e colunas analíticas reversas em modo de carga positiva e modo de carga negativa na pasta /aduct. Os usuários também podem editar sua própria lista de adutos de acordo com seu projeto de pesquisa. A lista de adutos deve estar no mesmo formato da lista fornecida.
  2. Realize a identificação metabólica e o controle FDR usando XY-Meta:XY-Meta.exe -S /XY-Meta-Win/config/parameter.default -D /msv000084112/ pos_wt-1_a.mgf -R /banco de dados/GNPS-NIST14-MATCHES.mgf.
    NOTA: XY-Meta não suporta curingas em parâmetros. Portanto, um único comando deve ser usado para processar cada arquivo mgf. Para um grande número de arquivos, um arquivo em lote é recomendado.

5. Análise diferencial

NOTA: metaX é um pacote R de código aberto. Por favor, instale-o de acordo com o guia em https://github.com/wenbostar/metaX. 8GB de RAM é necessário para esta análise.

  1. Editar um arquivo sampleList.txt para especificar a amostra e seus dados de MS correspondentes. Consulte o Material Complementar 2.
    NOTA: metaX suporta análise quantitativa para os conjuntos de dados com amostras de QC. Ao usar amostras de QC, por favor, modifique a propriedade da classe para na para amostras de QC.
  2. Criar/pasta de saída para armazenar os resultados da análise quantitativa. Use R para executar o script em Material Suplementar 3 para usar metaX para quantificar os grupos MOCK e WT.
    NOTA: Antes de executar o script em Material Suplementar 3, modifique os caminhos no script para os caminhos locais reais.

6. Integração dos resultados qualitativos e quantitativos

  1. Execute o script R em Material Suplementar 4 para anotar os picos em análise qualitativa e quantitativa utilizando identificações metabólicas.
    NOTA: Antes de executar o script em Material Suplementar 4, por favor, modifique os caminhos no script para seus caminhos locais reais.

Access restricted. Please log in or start a trial to view this content.

Resultados

Os dados brutos de msv000084112 foram convertidos por msconvert.exe e arquivos MGF (Material Suplementar S6).

XY-Meta gerou arquivo GNPS-NIST14-MATCHES_Decoy.mgf em /pasta de banco de dados. Esta é a biblioteca de isca gerada a partir da biblioteca espectral de referência original GNPS-NIST14-MATCHES.mgf. Esta biblioteca de isca pode ser reutilizada. Ao reutilizar esta biblioteca de isca, o usuário deve definir o decoy_pattern como 1 em arquivo parameter.default e definir o...

Access restricted. Please log in or start a trial to view this content.

Discussão

O controle fdr de metabólitos não-alvo tem sido um grande desafio. Aqui, demonstramos um pipeline completo de análise metabolômica não-alvo em larga escala (qualitativa e quantitativa) com controle FDR. Isso reduz efetivamente os falsos positivos, que são muito comuns na análise de ESM.

Preparar uma biblioteca espectral de referência apropriada para o seu estudo é um ponto-chave. Uma identificação de MS/MS bem-sucedida e sensível requer não apenas algoritmos adequados de correspon...

Access restricted. Please log in or start a trial to view this content.

Divulgações

Sem conflitos de interesse.

Agradecimentos

Este trabalho é apoiado pelo Programa Nacional de Pesquisa e Desenvolvimento de Chaves (2018YFC0910200/2017YFA0505001) e pelo Programa de P&D De Chaves de Guangdong (2019B0226001).

Access restricted. Please log in or start a trial to view this content.

Materiais

NameCompanyCatalog NumberComments
GNPSopen sourcen/ahttps://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp
XY-Metaopen sourcen/ahttps://github.com/DLI-ShenZhen/XY-Meta
metaXopen sourcen/ahttps://github.com/wenbostar/metaX
ProteoWizardFree Download3.0.22116.18c918b-x86_64https://proteowizard.sourceforge.io/download.html
CHI.ClientFree Downloadndp48-x86-x64-allos-enuhttp://www.chi-biotech.com/technology.html?ty=ypt

Referências

  1. Misra, B. B., Fahrmann, J. F., Grapov, D. Review of emerging metabolomic tools and resources: 2015-2016. Electrophoresis. 38 (18), 2257-2274 (2017).
  2. Idle, J. R., Gonzalez, F. J. Metabolomics. Cell Metabolism. 6 (5), 348-351 (2007).
  3. Fiehn, O. Metabolomics — the link between genotypes and phenotypes. Functional Genomics. Town, C. , Springer. Netherlands. Dordrecht. 155-171 (2002).
  4. Functional Genomics. Town, C. , Springer. Netherlands. Dordrecht. (2002).
  5. Dettmer, K., Aronov, P. A., Hammock, B. D. Mass spectrometry-based metabolomics. Mass Spectrometry Reviews. 26 (1), 51-78 (2007).
  6. Vinayavekhin, N., Saghatelian, A. Untargeted metabolomics. Current Protocols in Molecular Biology. , Chapter 30, Unit 30.1 1-24 (2010).
  7. Chaleckis, R., Meister, I., Zhang, P., Wheelock, C. E. Challenges, progress and promises of metabolite annotation for LC-MS-based metabolomics. Current Opinion in Biotechnology. 55, 44-50 (2019).
  8. Palmer, A., et al. FDR-controlled metabolite annotation for high-resolution imaging mass spectrometry. Nature Methods. 14 (1), 57-60 (2017).
  9. Scheubert, K., et al. Significance estimation for large scale metabolomics annotations by spectral matching. Nature Communications. 8 (1), 1494(2017).
  10. Schrimpe-Rutledge, A. C., Codreanu, S. G., Sherrod, S. D., McLean, J. A. Untargeted metabolomics strategies-challenges and emerging directions. Journal of the American Society for Mass Spectrometry. 27 (12), 1897-1905 (2016).
  11. Blaženović, I., Kind, T., Ji, J., Fiehn, O. Software tools and approaches for compound identification of LC-MS/MS data in metabolomics. Metabolites. 8 (2), (2018).
  12. Katajamaa, M., Miettinen, J., Oresic, M. MZmine: toolbox for processing and visualization of mass spectrometry based molecular profile data. Bioinformatics. 22 (5), Oxford, England. 634-636 (2006).
  13. Tsugawa, H., et al. Hydrogen rearrangement rules: computational MS/MS fragmentation and structure elucidation using MS-FINDER software. Analytical chemistry. 88 (16), 7946-7958 (2016).
  14. Wang, F., et al. CFM-ID 4.0: More accurate ESI-MS/MS spectral prediction and compound identification. Analytical Chemistry. 93 (34), 11692-11700 (2021).
  15. Ruttkies, C., Schymanski, E. L., Wolf, S., Hollender, J., Neumann, S. MetFrag relaunched: incorporating strategies beyond in silico fragmentation. Journal of Cheminformatics. 8, 3(2016).
  16. Delabriere, A., Warmer, P., Brennsteiner, V., Zamboni, N. SLAW: A scalable and self-optimizing processing workflow for untargeted LC-MS. Analytical chemistry. 93 (45), 15024-15032 (2021).
  17. Wang, X., et al. Target-decoy-based false discovery rate estimation for large-scale metabolite identification. Journal of Proteome Research. 17 (7), 2328-2334 (2018).
  18. Li, D., et al. XY-Meta: a high-efficiency search engine for large-scale metabolome annotation with accurate FDR estimation. Analytical Chemistry. 92 (8), 5701-5707 (2020).
  19. Wen, B., Mei, Z., Zeng, C., Liu, S. metaX: a flexible and comprehensive software for processing metabolomics data. BMC Bioinformatics. 18 (1), 183(2017).
  20. Aberg, K. M., Torgrip, R. J. O., Kolmert, J., Schuppe-Koistinen, I., Lindberg, J. Feature detection and alignment of hyphenated chromatographic-mass spectrometric data. Extraction of pure ion chromatograms using Kalman tracking. Journal of Chromatography. A. 1192 (1), 139-146 (2008).
  21. Liu, Q., et al. Addressing the batch effect issue for LC/MS metabolomics data in data preprocessing. Scientific Reports. 10 (1), 13856(2020).
  22. Han, W., Li, L. Evaluating and minimizing batch effects in metabolomics. Mass Spectrometry Reviews. 41 (3), 421-442 (2022).
  23. Fei, F., Bowdish, D. M. E., McCarry, B. E. Comprehensive and simultaneous coverage of lipid and polar metabolites for endogenous cellular metabolomics using HILIC-TOF-MS. Analytical and Bioanalytical Chemistry. 406 (15), 3723-3733 (2014).
  24. Smith, C. A., Want, E. J., O'Maille, G., Abagyan, R., Siuzdak, G. XCMS: processing mass spectrometry data for metabolite profiling using nonlinear peak alignment, matching, and identification. Analytical Chemistry. 78 (3), 779-787 (2006).
  25. Giacomoni, F., et al. Workflow4Metabolomics: a collaborative research infrastructure for computational metabolomics. Bioinformatics. 31 (9), Oxford, England. 1493-1495 (2015).
  26. Chang, H. -Y., et al. iMet-Q: A user-friendly tool for label-free metabolomics quantitation using dynamic peak-width determination. PloS One. 11 (1), 0146112(2016).
  27. Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
  28. Schmid, R., et al. Ion identity molecular networking for mass spectrometry-based metabolomics in the GNPS environment. Nature Communications. 12 (1), 3832(2021).
  29. Kessner, D., Chambers, M., Burke, R., Agus, D., Mallick, P. ProteoWizard: open source software for rapid proteomics tools development. Bioinformatics. 24 (21), Oxford, England. 2534-2536 (2008).
  30. Johnson, S. R., Lange, B. M. Open-access metabolomics databases for natural product research: present capabilities and future potential. Frontiers in Bioengineering and Biotechnology. 3, 22(2015).
  31. Horai, H., et al. MassBank: a public repository for sharing mass spectral data for life sciences. Journal of Mass Spectrometry: JMS. 45 (7), 703-714 (2010).
  32. Rawlinson, C., et al. Hierarchical clustering of MS/MS spectra from the firefly metabolome identifies new lucibufagin compounds. Scientific Reports. 10 (1), 6043(2020).

Access restricted. Please log in or start a trial to view this content.

Reimpressões e Permissões

Solicitar permissão para reutilizar o texto ou figuras deste artigo JoVE

Solicitar Permissão

Explore Mais Artigos

Bioqu micaEdi o 187

This article has been published

Video Coming Soon

JoVE Logo

Privacidade

Termos de uso

Políticas

Pesquisa

Educação

SOBRE A JoVE

Copyright © 2025 MyJoVE Corporation. Todos os direitos reservados