JoVE Logo

Accedi

È necessario avere un abbonamento a JoVE per visualizzare questo. Accedi o inizia la tua prova gratuita.

In questo articolo

  • Riepilogo
  • Abstract
  • Introduzione
  • Protocollo
  • Risultati
  • Discussione
  • Divulgazioni
  • Riconoscimenti
  • Materiali
  • Riferimenti
  • Ristampe e Autorizzazioni

Riepilogo

Abbiamo costruito un flusso di lavoro metabolomico non mirato che integrava XY-Meta e metaX insieme. In questo protocollo, abbiamo mostrato come utilizzare XY-Meta per generare una libreria spettrale esca dal riferimento spettrale ad accesso aperto, quindi eseguito il controllo FDR e utilizzato il metaX per quantificare i metaboliti dopo aver identificato gli spettri di metabolomica.

Abstract

Le tecniche di metabolomica non mirata sono state ampiamente utilizzate negli ultimi anni. Tuttavia, il rapido aumento della produttività e del numero di campioni crea un'enorme quantità di spettri, ponendo sfide per il controllo di qualità degli spettri della spettrometria di massa. Per ridurre i falsi positivi, è necessario il controllo di qualità del tasso di falsa scoperta (FDR). Recentemente, abbiamo sviluppato un software per il controllo FDR dell'identificazione del metaboloma non mirato che si basa su una strategia Target-Decoy denominata XY-Meta. Qui, abbiamo dimostrato una pipeline di analisi completa che integra XY-Meta e metaX insieme. Questo protocollo mostra come utilizzare XY-meta per generare un database esca da un database di riferimento esistente ed eseguire il controllo FDR utilizzando la strategia Target-Decoy per l'identificazione del metaboloma su larga scala su un set di dati ad accesso aperto. L'analisi differenziale e l'annotazione dei metaboliti sono state eseguite dopo l'esecuzione di metaX per il rilevamento e la quantificazione dei picchi dei metaboliti. Al fine di aiutare più ricercatori, abbiamo anche sviluppato una piattaforma di analisi basata su cloud di facile utilizzo per queste analisi, senza la necessità di competenze bioinformatiche o di linguaggi informatici.

Introduzione

I metaboliti svolgono un ruolo importante nei processi biologici. I metaboliti sono spesso regolatori di vari processi come il trasferimento di energia, la regolazione ormonale, la regolazione dei neurotrasmettitori, le comunicazioni cellulari e le modifiche proteiche post-traduzionali, ecc. 1,2,3,4. La metabolomica non mirata fornisce una visione globale di numerosi metaboliti 5,6. Con i progressi nella spettrometria di massa e nelle tecnologie di cromatografia, il throughput degli spettri MS/MS del metaboloma è in rapido aumento negli ultimi anni 7,8,9,10,11. Per identificare i metaboliti da questi enormi set di dati, sono stati sviluppati vari software di annotazione11, come MZmine12, MS-FINDER13, CFM-ID14, MetFrag15 e SLAW16. Tuttavia, queste identificazioni spesso contengono molti falsi positivi. I motivi includono: (1) Gli spettri MS/MS contengono rumore casuale, che può fuorviare la corrispondenza dei picchi. (2) Gli isomeri e le differenze nelle energie di frammentazione causano impronte digitali multiple degli spettri e quindi aumentano il volume della libreria di riferimento. (3) La qualità delle librerie di riferimento varia. È necessario uno standard adeguato per costruire una buona libreria spettrale di riferimento. Pertanto, un controllo sistematico del tasso di falsa scoperta (FDR) per la metabolomica non mirata è essenziale per la ricerca sul metaboloma funzionale 7,8,9,17.

Sia l'approccio Empiric Bayes che la strategia Target-Decoy hanno affrontato il problema del controllo FDR in generale. Kerstin Scheubert et al. hanno dimostrato che la strategia Target-Decoy sul database esca generato dal metodo basato sulla frammentazione ad albero è il metodo migliore per il controllo FDR9. Xusheng Wang et al. hanno progettato un metodo per la generazione di esca basato sulla regola dell'ottetto in chimica e hanno migliorato la precisione della stima FDR17. La libreria spettrale per la generazione del database esca è stata dimostrata per prestazioni migliori18. Qui, abbiamo migliorato il metodo basato su libreria spettrale e sviluppato un software chiamato XY-Meta19 che può migliorare ulteriormente la precisione della stima FDR. Utilizza la libreria spettrale di riferimento esistente per generare una libreria esca per il controllo FDR nello schema Target-Decoy. XY-Meta supporta i propri algoritmi di corrispondenza degli spettri e di somiglianza del coseno. Consente la ricerca convenzionale e le modalità di ricerca iterativa. Nella fase di valutazione FDR, supporta la modalità concatenata Target-Decoy e la modalità separata. Per una maggiore flessibilità, XY-Meta accetta librerie di esca esterne.

Il rilevamento dei picchi e la quantificazione dei metaboliti è anche un passo importante dell'analisi del metaboloma non mirato. Il rilevamento dei picchi è il metodo principale per l'identificazione del metaboloma. In generale, l'accuratezza del rilevamento dei picchi dei metaboliti è stata influenzata da molteplici fattori, come i segnali di rumore della spettrometria di massa, la bassa abbondanza di metaboliti, contaminanti e prodotti di degradazione dei metaboliti20. Quando il numero di campioni di è troppo grande o la colonna di cromatografia liquida è stata sostituita in esperimenti di metaboloma non mirato, possono apparire notevoli effetti batch, che è una grande sfida per la quantificazione del metaboloma 21,22,23. Attualmente, software come XCMS24, Workflow4Metabolomic25, iMet-Q26 e metaX19 possono eseguire il rilevamento dei picchi e la quantificazione del metaboloma non mirato, ma suggeriamo che la pipeline di metaX sia più completa e più facile da usare. Qui, dimostriamo il processo di identificazione e controllo FDR per un set di dati pubblicamente disponibile msv000084112 utilizzando XY-Meta e il rilevamento e la quantificazione dei picchi dei metaboliti utilizzando metaX. Questo flusso di lavoro richiede solo due gruppi e ogni gruppo richiede almeno due esempi. I dati degli spettri MS/MS sono necessari, indipendentemente dalla piattaforma dello spettrometro di massa, dalla modalità di ionizzazione, dalla modalità di carica e dal tipo di campione, e possono supportare la normalizzazione basata su campioni e la normalizzazione basata su picchi. Seguendo questo esempio, i ricercatori possono eseguire l'identificazione e la quantificazione della metabolomica in modo facile da gestire. L'utilizzo di questa pipeline richiede funzionalità di programmazione R. Per aiutare il ricercatore senza alcuna conoscenza di programmazione, abbiamo anche sviluppato una piattaforma di analisi cloud per l'analisi metabolomica. Abbiamo dimostrato questa piattaforma di analisi cloud nel Materiale supplementare 5.

Access restricted. Please log in or start a trial to view this content.

Protocollo

1. Preparare set di dati di metabolomica per l'analisi

NOTA: in questa dimostrazione vengono utilizzati set di dati di metabolomica senza campione QC. Sono necessari dati per i gruppi di casi e di controllo. Per la dimostrazione, utilizziamo un set di dati pubblico nel database PNL27.

  1. Vai alla pagina web https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp. Fare clic su Sfoglia set di dati.
  2. Cerca la parola chiave "msv000084112" nella colonna Titolo . Fare clic sul numero ID del set di dati per i dettagli e scaricare il set di dati tramite FTP.
  3. Inserire i dati grezzi nella cartella /msv000084112.
    NOTA: questo set di dati è stato acquisito utilizzando C18 RP-UHPLC sulla piattaforma Q Exactive in modalità positiva. Rappresenta una coorte con una malattia non caratterizzata del metabolismo dei dati dei campioni di urina, inclusi 33 campioni di persone sane, 12 campioni in bianco, due campioni di miscelazione e 82 campioni di pazienti28 (Materiale supplementare 8). Per dimostrare il flusso di lavoro, abbiamo scelto in modo casuale sei campioni di persone sane (NH) come gruppo di controllo e sei campioni con la malattia (NT) come gruppo di casi per eseguire il flusso di lavoro.

2. Conversione del formato dei dati

NOTA: se il set di dati è costituito dai dati non elaborati generati direttamente dallo spettrometro di massa, in genere è in formato .raw, wiff o cdf. Dovrebbero essere convertiti nei formati mzXML e mgf. Qui, usiamo lo strumento msconvert nel pacchetto ProteoWizard29 per eseguire la conversione del formato.

  1. Scarica ProteoWizard da https://proteowizard.sourceforge.io/download.html e installalo.
  2. Converti il formato dati utilizzando msconvert.exe nel percorso di installazione di ProteoWizard.
    1. Convertire i dati non elaborati in formato mzXML e archiviarli nella cartella /mzXML:/msconvert.exe /raw/*.raw -o /raw/mzXML/ --filter "peakPicking true [1,2]" --filter "zeroSamples removeExtra" --mzML --zlib --mz64 --filter "msLevel 1-2" --filter "titleMaker ... ".
    2. Convertire i dati raw/mzXML in formato mgf e memorizzarli nella cartella /mgf:/msconvert.exe /msv000084112/*.raw -o /msv000084112/mgf/ --filter "peakPicking true [1,2]" --filter "zeroSamples removeExtra" --mgf --mz64 --filter "msLevel 1-2" --filter "titleMaker ... ".

3. Preparare la libreria spettrale di riferimento per i metaboliti

NOTA: XY-meta supporta le librerie spettrali di riferimento solo in formato mgf.

  1. Vai alla pagina web https://gnps.ucsd.edu/ProteoSAFe/libraries.jsp. Cerca la parola chiave "NIST" per trovare l'elemento. Fare clic su Visualizza per i dettagli e scaricare la libreria.
    NOTA: le biblioteche spettrali pubbliche GNPS hanno raccolto molte librerie di metaboliti, organizzate in tipo, origine, specie e modalità di raccolta. Sebbene solo una piccola parte di queste librerie sia generata utilizzando materiali standard, di solito sono sufficienti per la maggior parte della ricerca fondamentale.
  2. Inserire la libreria scaricata GNPS-NIST14-MATCHES.mgf nella cartella /database.

4. Identificazione dei metaboliti e controllo FDR

  1. Scarica XY-meta (versione Windows). Individuare il file di configurazione dei parametri parameter parameter.default nella cartella /XY-Meta-Win/config/. Modificarne il contenuto in base al Materiale supplementare 1.
    NOTA: In soluzione, i metaboliti spesso formano addotti con anioni o cationi, il che porta a uno spostamento di massa degli ioni genitori. Pertanto, è necessario impostare i tipi di addotti. Abbiamo fornito elenchi di addotti per colonne a scambio ionico e colonne analitiche inverse in modalità carica positiva e modalità carica negativa nella cartella /adduct. Gli utenti possono anche modificare il proprio elenco di addotti in base al proprio progetto di ricerca. L'elenco degli addotti deve essere nello stesso formato dell'elenco fornito.
  2. Eseguire l'identificazione del metabolita e il controllo FDR utilizzando XY-Meta:XY-Meta.exe -S /XY-Meta-Win/config/parameter.default -D /msv000084112/ pos_wt-1_a.mgf -R /database/GNPS-NIST14-MATCHES.mgf.
    NOTA: XY-Meta non supporta i caratteri jolly nei parametri. Pertanto, è necessario utilizzare un singolo comando per elaborare ogni file mgf. Per un numero elevato di file, si consiglia un file batch.

5. Analisi differenziale

NOTA: metaX è un pacchetto R open source. Si prega di installarlo secondo la guida su https://github.com/wenbostar/metaX. Per questa analisi sono necessari 8 GB di RAM.

  1. Modificare un file sampleList.txt per specificare l'esempio e i dati MS corrispondenti. Si prega di fare riferimento al Materiale supplementare 2.
    NOTA: metaX supporta l'analisi quantitativa per i set di dati con campioni QC. Quando si utilizzano campioni QC, modificare la proprietà della classe in NA per i campioni QC.
  2. Creare una cartella /output per memorizzare i risultati dell'analisi quantitativa. Utilizzare R per eseguire lo script nel Materiale supplementare 3 per utilizzare metaX per quantificare i gruppi MOCK e WT.
    Nota : prima di eseguire lo script in Materiale supplementare 3, modificare i percorsi nello script per i percorsi locali effettivi.

6. Integrazione dei risultati qualitativi e quantitativi

  1. Eseguire lo script R nel materiale supplementare 4 per annotare i picchi nell'analisi qualitativa e quantitativa utilizzando le identificazioni dei metaboliti.
    NOTA: prima di eseguire lo script nel Materiale supplementare 4, modificare i percorsi nello script in base ai percorsi locali effettivi.

Access restricted. Please log in or start a trial to view this content.

Risultati

I dati grezzi di msv000084112 sono stati convertiti da msconvert.exe e generati file mgf (materiale supplementare S6).

XY-Meta ha generato il file GNPS-NIST14-MATCHES_Decoy.mgf nella cartella /database. Questa è la libreria esca generata dalla libreria spettrale di riferimento originale GNPS-NIST14-MATCHES.mgf. Questa libreria di esca può essere riutilizzata. Quando si riutilizza questa libreria di esca, l'utente deve impostare il decoy_pattern come 1 nel file parameter.defa...

Access restricted. Please log in or start a trial to view this content.

Discussione

Il controllo FDR dei metaboliti non mirati è stata una grande sfida. Qui, abbiamo dimostrato una pipeline completa di analisi metabolomica non mirata su larga scala (qualitativa e quantitativa) con controllo FDR. Ciò riduce efficacemente i falsi positivi, che sono molto comuni nell'analisi della SM.

Preparare una libreria spettrale di riferimento appropriata per il tuo studio è un punto chiave. Un'identificazione MS/MS corretta e sensibile richiede non solo algoritmi di corrispondenza adegu...

Access restricted. Please log in or start a trial to view this content.

Divulgazioni

Nessun conflitto di interessi.

Riconoscimenti

Questo lavoro è supportato dal National Key Research and Development Program (2018YFC0910200/2017YFA0505001) e dal Guangdong Key R&D Program (2019B020226001).

Access restricted. Please log in or start a trial to view this content.

Materiali

NameCompanyCatalog NumberComments
GNPSopen sourcen/ahttps://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp
XY-Metaopen sourcen/ahttps://github.com/DLI-ShenZhen/XY-Meta
metaXopen sourcen/ahttps://github.com/wenbostar/metaX
ProteoWizardFree Download3.0.22116.18c918b-x86_64https://proteowizard.sourceforge.io/download.html
CHI.ClientFree Downloadndp48-x86-x64-allos-enuhttp://www.chi-biotech.com/technology.html?ty=ypt

Riferimenti

  1. Misra, B. B., Fahrmann, J. F., Grapov, D. Review of emerging metabolomic tools and resources: 2015-2016. Electrophoresis. 38 (18), 2257-2274 (2017).
  2. Idle, J. R., Gonzalez, F. J. Metabolomics. Cell Metabolism. 6 (5), 348-351 (2007).
  3. Fiehn, O. Metabolomics — the link between genotypes and phenotypes. Functional Genomics. Town, C. , Springer. Netherlands. Dordrecht. 155-171 (2002).
  4. Functional Genomics. Town, C. , Springer. Netherlands. Dordrecht. (2002).
  5. Dettmer, K., Aronov, P. A., Hammock, B. D. Mass spectrometry-based metabolomics. Mass Spectrometry Reviews. 26 (1), 51-78 (2007).
  6. Vinayavekhin, N., Saghatelian, A. Untargeted metabolomics. Current Protocols in Molecular Biology. , Chapter 30, Unit 30.1 1-24 (2010).
  7. Chaleckis, R., Meister, I., Zhang, P., Wheelock, C. E. Challenges, progress and promises of metabolite annotation for LC-MS-based metabolomics. Current Opinion in Biotechnology. 55, 44-50 (2019).
  8. Palmer, A., et al. FDR-controlled metabolite annotation for high-resolution imaging mass spectrometry. Nature Methods. 14 (1), 57-60 (2017).
  9. Scheubert, K., et al. Significance estimation for large scale metabolomics annotations by spectral matching. Nature Communications. 8 (1), 1494(2017).
  10. Schrimpe-Rutledge, A. C., Codreanu, S. G., Sherrod, S. D., McLean, J. A. Untargeted metabolomics strategies-challenges and emerging directions. Journal of the American Society for Mass Spectrometry. 27 (12), 1897-1905 (2016).
  11. Blaženović, I., Kind, T., Ji, J., Fiehn, O. Software tools and approaches for compound identification of LC-MS/MS data in metabolomics. Metabolites. 8 (2), (2018).
  12. Katajamaa, M., Miettinen, J., Oresic, M. MZmine: toolbox for processing and visualization of mass spectrometry based molecular profile data. Bioinformatics. 22 (5), Oxford, England. 634-636 (2006).
  13. Tsugawa, H., et al. Hydrogen rearrangement rules: computational MS/MS fragmentation and structure elucidation using MS-FINDER software. Analytical chemistry. 88 (16), 7946-7958 (2016).
  14. Wang, F., et al. CFM-ID 4.0: More accurate ESI-MS/MS spectral prediction and compound identification. Analytical Chemistry. 93 (34), 11692-11700 (2021).
  15. Ruttkies, C., Schymanski, E. L., Wolf, S., Hollender, J., Neumann, S. MetFrag relaunched: incorporating strategies beyond in silico fragmentation. Journal of Cheminformatics. 8, 3(2016).
  16. Delabriere, A., Warmer, P., Brennsteiner, V., Zamboni, N. SLAW: A scalable and self-optimizing processing workflow for untargeted LC-MS. Analytical chemistry. 93 (45), 15024-15032 (2021).
  17. Wang, X., et al. Target-decoy-based false discovery rate estimation for large-scale metabolite identification. Journal of Proteome Research. 17 (7), 2328-2334 (2018).
  18. Li, D., et al. XY-Meta: a high-efficiency search engine for large-scale metabolome annotation with accurate FDR estimation. Analytical Chemistry. 92 (8), 5701-5707 (2020).
  19. Wen, B., Mei, Z., Zeng, C., Liu, S. metaX: a flexible and comprehensive software for processing metabolomics data. BMC Bioinformatics. 18 (1), 183(2017).
  20. Aberg, K. M., Torgrip, R. J. O., Kolmert, J., Schuppe-Koistinen, I., Lindberg, J. Feature detection and alignment of hyphenated chromatographic-mass spectrometric data. Extraction of pure ion chromatograms using Kalman tracking. Journal of Chromatography. A. 1192 (1), 139-146 (2008).
  21. Liu, Q., et al. Addressing the batch effect issue for LC/MS metabolomics data in data preprocessing. Scientific Reports. 10 (1), 13856(2020).
  22. Han, W., Li, L. Evaluating and minimizing batch effects in metabolomics. Mass Spectrometry Reviews. 41 (3), 421-442 (2022).
  23. Fei, F., Bowdish, D. M. E., McCarry, B. E. Comprehensive and simultaneous coverage of lipid and polar metabolites for endogenous cellular metabolomics using HILIC-TOF-MS. Analytical and Bioanalytical Chemistry. 406 (15), 3723-3733 (2014).
  24. Smith, C. A., Want, E. J., O'Maille, G., Abagyan, R., Siuzdak, G. XCMS: processing mass spectrometry data for metabolite profiling using nonlinear peak alignment, matching, and identification. Analytical Chemistry. 78 (3), 779-787 (2006).
  25. Giacomoni, F., et al. Workflow4Metabolomics: a collaborative research infrastructure for computational metabolomics. Bioinformatics. 31 (9), Oxford, England. 1493-1495 (2015).
  26. Chang, H. -Y., et al. iMet-Q: A user-friendly tool for label-free metabolomics quantitation using dynamic peak-width determination. PloS One. 11 (1), 0146112(2016).
  27. Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
  28. Schmid, R., et al. Ion identity molecular networking for mass spectrometry-based metabolomics in the GNPS environment. Nature Communications. 12 (1), 3832(2021).
  29. Kessner, D., Chambers, M., Burke, R., Agus, D., Mallick, P. ProteoWizard: open source software for rapid proteomics tools development. Bioinformatics. 24 (21), Oxford, England. 2534-2536 (2008).
  30. Johnson, S. R., Lange, B. M. Open-access metabolomics databases for natural product research: present capabilities and future potential. Frontiers in Bioengineering and Biotechnology. 3, 22(2015).
  31. Horai, H., et al. MassBank: a public repository for sharing mass spectral data for life sciences. Journal of Mass Spectrometry: JMS. 45 (7), 703-714 (2010).
  32. Rawlinson, C., et al. Hierarchical clustering of MS/MS spectra from the firefly metabolome identifies new lucibufagin compounds. Scientific Reports. 10 (1), 6043(2020).

Access restricted. Please log in or start a trial to view this content.

Ristampe e Autorizzazioni

Richiedi autorizzazione per utilizzare il testo o le figure di questo articolo JoVE

Richiedi Autorizzazione

Esplora altri articoli

BiochimicaNumero 187

This article has been published

Video Coming Soon

JoVE Logo

Riservatezza

Condizioni di utilizzo

Politiche

Ricerca

Didattica

CHI SIAMO

Copyright © 2025 MyJoVE Corporation. Tutti i diritti riservati