Method Article
IDBac è una pipeline di bioinformatica a base di spettrometria di massa open source che integra dati provenienti da proteine intatte e spettri di metaboliti specializzati, raccolti su materiale cellulare raschiato da colonie batteriche. La conduttura consente ai ricercatori di organizzare rapidamente centinaia di migliaia di colonie batteriche in gruppi tassonomici putativi e di differenziarle ulteriormente in base alla produzione specializzata di metaboliti.
Per visualizzare la relazione tra la filoicina batterica e la produzione specializzata di metaboliti di colonie batteriche che crescono sull'agar nutritivo, abbiamo sviluppato IDBac, un sistema di desorpizzazione/ionizzazione del laser a matrice a basso costo e ad alta produttività spettrorometria di massa a tempo di volo (MALDI-TOF MS) pipeline bioinformatica. Il software IDBac è progettato per i non esperti, è liberamente disponibile e in grado di analizzare da poche a migliaia di colonie batteriche. Qui presentiamo le procedure per la preparazione di colonie batteriche per l'analisi MALDI-TOF MS, il funzionamento dello strumento MS e l'elaborazione e la visualizzazione dei dati in IDBac. In particolare, istruiamo gli utenti su come raggruppare i batteri in dendrogrammi sulla base delle impronte digitali delle proteine MS e creare interattivamente Metabolite Association Networks (MAN) da dati specializzati sui metaboliti.
Una delle principali barriere per i ricercatori che studiano la funzione batterica è la capacità di valutare rapidamente e simultaneamente l'identità tassonomica di un microrganismo e la sua capacità di produrre metaboliti specializzati. Ciò ha impedito progressi significativi nella comprensione della relazione tra filologia batterica e produzione specializzata di metaboliti nella maggior parte dei batteri isolati dall'ambiente. Sebbene i metodi basati sulla SM che utilizzano impronte proteiche per raggruppare e identificare i batteri siano ben descritti1,2,3,4, questi studi sono stati generalmente eseguiti su piccoli gruppi di isolati, in modo specifico per le specie. È importante sottolineare che le informazioni sulla produzione di metaboliti specializzati, uno dei principali fattori della funzione microbica nell'ambiente, sono rimaste non incorporate in questi studi. Silva et al.5 ha recentemente fornito una storia completa che descrive il sottoutilizzo di MALDI-TOF MS per analizzare i metaboliti specializzati e la carenza di software per alleviare gli attuali colli di bottiglia bioinformatica. Per far fronte a queste carenze, abbiamo creato IDBac, una pipeline di bioinformatica che integra modalità lineare e riflettore di MALDI-TOF MS6. Ciò consente agli utenti di visualizzare e differenziare rapidamente gli isolati batterici in base alle impronte digitali MS sia proteiche che specializzate.
IDBac è conveniente, ad alta velocità effettiva e progettato per l'utente laico. È liberamente disponibile (chasemc.github.io/IDBac) e richiede solo l'accesso a uno spettrometro di massa MALDI-TOF (la modalità riflettore sarà necessaria per l'analisi specialized dei metaboliti). La preparazione del campione si basa sul semplice metodo di "trasferimento diretto esteso"7,8 e i dati vengono raccolti con acquisizioni lineari e di riflettore consecutive su un singolo punto MALDI-target. Con IDBac, è possibile analizzare la produzione di filo putativo e metabolita specializzata di centinaia di colonie in meno di quattro ore, tra cui la preparazione del campione, l'acquisizione dei dati e la visualizzazione dei dati. Questo presenta un significativo vantaggio in termini di tempo e costi rispetto ai metodi tradizionali di identificazione dei batteri (come il sequenziamento genico) e all'analisi della produzione metabolica (spettrometria cromatometria-massa liquida [LCMS] e metodi cromatografici simili).
Utilizzando i dati ottenuti nell'analisi in modalità lineare, IDBac impiega il clustering gerarchico per rappresentare la parentela degli spettri proteici. Poiché gli spettri rappresentano per lo più proteine ribosomiche ionizzate, forniscono una rappresentazione della diversità filogenetica presente in un campione. Inoltre, IDBac incorpora dati in modalità riflettore per visualizzare le impronte digitali dei metaboliti specializzati come Metabolite Association Networks (MAN). I MAN sono reti bipartite che consentono una facile visualizzazione della produzione di metaboliti condivisi e unici tra isolati batterici. La piattaforma IDBac consente ai ricercatori di analizzare sia i dati sulle proteine che sui metaboliti specializzati in tandem, ma anche individualmente se viene acquisito un solo tipo di dati. È importante sottolineare che IDBac elabora i dati non elaborati degli strumenti Bruker e Xiamen, nonché txt, tab, csv, mzXML e mzML. Ciò elimina la necessità di conversione manuale e formattazione dei set di dati e riduce significativamente il rischio di errore dell'utente o di gestione errata dei dati MS.
1. Preparazione della matrice MALDI
2. Preparazione di piastre bersaglio MALDI
NOTA: Vedere Sauer et al.7, per maggiori dettagli.
Figura 1: piastra bersaglio MALDI che mostra due diversi isolati prima di aggiungere acido formico e matrice MALDI (primi 3 punti - Bacillus sp.; 3 punti inferiori - Streptomyces sp.). Per entrambi, la colonna 3 rappresenta il campione in eccesso; la colonna 2 rappresenta la quantità appropriata di campione; colonna 1 rappresenta un campione insufficiente per l'analisi MALDI. Fare clic qui per visualizzare una versione più grande di questa figura.
3. Acquisizione dei dati
NOTA: i parametri generali per l'acquisizione dei dati sono elencati nella Tabella 1.
parametro | proteina | Metabolita specializzato |
Inizio massa (Da) | 1920 | 60 del sistema |
Fine massa (Da) | 21000 | 2700 |
Deflessione di massa (Da) | 1900 | 50 anni |
Colpi | 500 | 1000 |
Frequenza (Hz) | 2000 | 2000 |
Dimensioni laser | l f inv | medio |
MaxStdDev (ppm) | 300 | 30 milio |
Tabella 1.
Figura 2: Esempio di spettri proteici che mostrano l'effetto della modifica della potenza laser e del guadagno del rivelatore. La qualità degli spettri è migliore nel pannello A, e diminuisce fino a quando insufficiente qualità degli spettri nei pannelli C e D. Mentre lo spettro nel pannello B può comportare picchi utilizzabili, il pannello A visualizza i dati ottimali. Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 3: Esempio di spettri di metaboliti specializzati che mostrano l'effetto della modifica della potenza laser e del guadagno del rivelatore. La qualità degli spettri è migliore nel pannello A e diminuisce fino a quando non è insufficiente la qualità degli spettri nei pannelli C e D. Mentre lo spettro nel pannello B può comportare picchi utilizzabili, il pannello A visualizza i dati ottimali. Fare clic qui per visualizzare una versione più grande di questa figura.
4. Pulizia della piastra bersaglio MALDI (adattata da Sauer et al.7)
5. Installazione del software IDBac
6. A partire dai dati grezzi
NOTA: le spiegazioni dettagliate e le istruzioni di ogni fase di elaborazione dei dati sono incorporate all'interno di IDBac, tuttavia le principali analisi e input interattivi sono descritti di seguito.
Figura 4: passaggio di conversione e pre-elaborazione dei dati IDBac. IDBac converte gli spettri non elaborati nel formato mzML aperto e archivia mzML, elenchi di picco e informazioni di esempio in un database per ogni esperimento. Fare clic qui per visualizzare una versione più grande di questa figura.
7. Lavorare con esperimenti precedenti
Figura 5: pagina "Lavorare con esperimenti precedenti". Utilizza la pagina "Lavora con esperimenti precedenti" di IDBac per selezionare un esperimento da analizzare o modificare. Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 6: Immettere informazioni di esempio. All'interno della pagina "Utilizzo di esperimenti precedenti" gli utenti possono inserire informazioni su campioni come l'identità tassonomica, la posizione di raccolta, le condizioni di isolamento, ecc. Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 7: Trasferire i dati. La pagina "Utilizzo di esperimenti precedenti" contiene l'opzione per trasferire dati tra esperimenti esistenti e a nuovi esperimenti. Fare clic qui per visualizzare una versione più grande di questa figura.
8. Impostazione dell'analisi dei dati delle proteine e creazione di grafici a specchio
Figura 8: Scegliere la modalità di conservazione dei picchi per l'analisi. Dopo aver selezionato un esperimento da analizzare, visitando la pagina "Analisi dei dati proteici" e successivamente aprendo il menu "Scegli come vengono mantenuti i picchi per l'analisi" consente agli utenti di scegliere impostazioni come il rapporto segnale-rumore per mantenere i picchi. Il grafico speculare visualizzato (o dendrogramma) si aggiornerà automaticamente per riflettere le impostazioni scelte. Fare clic qui per visualizzare una versione più grande di questa figura.
9. Clustering di campioni utilizzando i dati delle proteine
Figura 9: Selezionare i campioni dell'esperimento scelto da includere all'interno del dendrogramma visualizzato. Fare clic qui per visualizzare una versione più grande di questa figura.
10. Personalizzazione del dendrogramma proteico
Figura 10: Regolare il dendrogramma. IDBac fornisce alcune opzioni per modificare l'aspetto del dendrogramma, questi possono essere trovati all'interno del menu "Regolare il dendrogramma". Ciò include la colorazione di rami ed etichette con k-mezzi, o "tagliando" il dendrogramma ad un'altezza fornita dall'utente. Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 11: Incorporare informazioni sui campioni. All'interno del menu "Regola il Dendrogram" è l'opzione "Incorpora informazioni sui campioni". Selezionando questa opzione si consentiranno di tracciare le informazioni sui campioni accanto al dendrogramma. Le informazioni di esempio vengono immesse nella pagina "Utilizzo di esperimenti precedenti". Fare clic qui per visualizzare una versione più grande di questa figura.
11. Inserire campioni da un esperimento separato nel dendrogramma
Figura 12: Inserire campioni dal menu Un altro esperimento. A volte è utile confrontare i campioni di un altro esperimento. Usa il menu "Inserisci campioni da un altro esperimento" per scegliere i campioni da includere all'interno del dendrogramma attualmente visualizzato. Fare clic qui per visualizzare una versione più grande di questa figura.
12. Analisi dei dati specializzati sui metaboliti e sulle reti di associazione dei metaboliti (MAN)
Figura 13: Pagina Analisi dei dati delle piccole molecole". Se un dendrogramma è stato creato da spettri proteici, verrà visualizzato all'interno della pagina "Small Molecule Data Analysis". Questa pagina mostrerà anche Metabolite Associate Networks (MAN) e Principle Components Analysis (PCA) per piccoli dati di molecola. Fare clic qui per visualizzare una versione più grande di questa figura.
13. Condivisione dei dati
Abbiamo analizzato sei ceppi di Micromonospora chokoriensis e due ceppi di Bacillus subtilis, precedentemente caratterizzati6, utilizzando i dati disponibili presso DOI: 10.5281/zenodo.2574096. Seguendo le istruzioni nella scheda A partire da dati non elaborati, è stata selezionata l'opzione Fare clic qui per convertire i file Bruker e sono seguite le istruzioni fornite da IDBac per ogni set di dati (Figura 14).
Dopo aver completato la conversione automatizzata e i passaggi di pre-elaborazione/picco, abbiamo proceduto alla creazione di un nuovo esperimento IDBac combinato trasferendo i campioni dei due esperimenti in un unico esperimento contenente sia Bacillus che Campioni di micromonosopora (Figura 15). L'analisi risultante ha comportato il confronto degli spettri proteici utilizzando grafici a specchio, come illustrato nella figura 16,che è stato utile per valutare la qualità degli spettri e regolare le impostazioni di selezione del picco. Figura 17 mostra uno screenshot dei risultati di clustering di proteine con le impostazioni predefinite selezionate. Il dendrogramma è stato colorato regolando la soglia sul grafico (appare come una linea tratteggiata). Da notare la netta separazione tra generi, con M. chokoriensis e B. subtilis isola il clustering separatamente.
Figura 18, Figura 19e Figura 20 evidenziare la possibilità di generare NOMI DI codice AD delle regioni selezionate dall'utente facendo clic e trascinando traslochi tra le proteine dendrogramma. Con questo siamo stati in grado di creare rapidamente MAN per confrontare solo i ceppi B. subtilis (Figura 18), solo i ceppi M. chokoriensis (Figura 19), e tutti i ceppi contemporaneamente (Figura 20). La funzione principale di queste reti è quella di fornire ai ricercatori un'ampia panoramica del grado di sovrapposizione dei metaboliti specializzati tra i batteri. Con questi dati in mano, i ricercatori hanno ora la capacità di prendere decisioni informate solo da una piccola quantità di materiale raschiato da una colonia batterica.
Figura 14: Elaborazione spectra. Gli spettri autoFlex di Bruker scaricati sono stati convertiti ed elaborati utilizzando IDBac. Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 15: Esperimento IDBac combinato. Poiché gli spettri Micromonospora e Bacillus sono stati raccolti su diverse placche bersaglio MALDI, i due esperimenti sono stati successivamente combinati in un unico esperimento, "Bacillus_Micromonsopora". Questo è stato fatto all'interno della scheda "Lavorare con esperimenti precedenti", seguendo le istruzioni all'interno del menu "Trasferire campioni da esperimenti precedenti a nuovi/altri esperimenti". Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 16: Confronto. Micromonspora e Bacillus spettri sono stati confrontati utilizzando i grafici a specchio all'interno della pagina "Protein Data Analysis". In definitiva, sono state scelte le impostazioni di picco predefinite. Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 17: Clustering gerarchico. Clustering gerarchico, utilizzando le impostazioni predefinite, correttamente raggruppato Bacillus e Micromonospora isola. Il dendrogramma è stato colorato "tagliando" il dendrogramma ad un'altezza arbitraria (visualizzato come una linea tratteggiata) e 100 bootstrap utilizzati per mostrare la fiducia nella diramazione. Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 18: MAN creato selezionando i ceppi Bacillus sp. dal dendrogramma proteico ha mostrato la produzione differenziale di metaboliti specializzati. Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 19: MAN creato selezionando i sei ceppi Micromonospora sp. dal dendrogramma proteico hanno mostrato la produzione differenziale di metaboliti specializzati. Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 20: Ceppi MAN di Bacillus sp. e Micromonospora sp. che mostrano una produzione differenziale di metaboliti specializzati. Fare clic qui per visualizzare una versione più grande di questa figura.
Il protocollo IDBac descrive la proteina batterica e l'acquisizione e l'analisi di dati sui metaboliti specializzati fino a 384 isolati batterici in 4 h da un singolo ricercatore. Con IDBac non è necessario estrarre il DNA dagli isolati batterici o generare estratti di metaboliti specializzati dai brodi di fermentazione liquida e analizzarli utilizzando metodi cromatografici. Invece, i dati sulle proteine e sui metaboliti specializzati vengono raccolti semplicemente diffondendo materiale dalle colonie batteriche direttamente su una piastra bersaglio MALDI. Questo riduce notevolmente il tempo e i costi associati a tecniche alternative come il sequenziamento genico 16S rRNA e LCMS9.
È importante aggiungere una matrice vuota e punti di calibrazione alla piastra MALDI, e si consiglia di utilizzare un numero appropriato di repliche per garantire la riproducibilità e la fiducia statistica. Il numero di repliche dipenderà dall'esperimento. Ad esempio, se un utente intende differenziare migliaia di colonie da una raccolta di piastre di diversità ambientale, potrebbero essere necessarie meno repliche (il nostro laboratorio raccoglie tre repliche tecniche per colonia). In alternativa, se un utente desidera creare un database personalizzato di ceppi da specifici taxa batterici per determinare rapidamente le classificazioni sottospecie di isolati sconosciuti, allora più repliche sono appropriate (il nostro laboratorio raccoglie otto repliche biologiche per ceppo).
IDBac è uno strumento per differenziare rapidamente gli isolati batterici altamente correlati sulla base di informazioni tassonomiche putative e produzione di metaboliti specializzati. Può integrare o servire come precursore di metodi ortogonali come analisi genetiche approfondite, studi che coinvolgono la produzione e la funzione dei metaboliti, o la caratterizzazione della struttura di metaboliti specializzati mediante spettroscopia a risonanza magnetica nucleare e/o LC-MS/MS.
La produzione specializzata di metaboliti (MAN IDBac) è altamente suscettibile alle condizioni di crescita batterica, in particolare utilizzando diversi supporti, che è una potenziale limitazione del metodo. Tuttavia questi tratti possono essere sfruttati dall'utente, come IDBac può facilmente generare MAN mostrando le differenze nella produzione di metaboliti specializzati in una varietà di condizioni di crescita. È importante notare che, sebbene le impronte digitali dei metaboliti specializzati possono variare a seconda della condizione di crescita, abbiamo dimostrato in precedenza che le impronte digitali delle proteine rimangono relativamente stabili in queste variabili (vedi Clark et al.6). Quando si tratta di piastre di diversità ambientale, si consiglia di purificare gli isolati batterici prima dell'analisi al fine di ridurre i possibili contributi dal cross-talk batterico vicino.
Infine, la mancanza di un database pubblico ricercabile di impronte digitali delle proteine MS è una grave carenza nell'uso di questo metodo per classificare i batteri ambientali sconosciuti. Abbiamo creato IDBac con questo in mente, e incluso la conversione automatica dei dati in un formato open source accettato dalla comunità (mzML)10,11,12 e progettato il software per consentire la ricerca, la condivisione e la creazione di database personalizzati. Stiamo creando una grande banca dati pubblica (>10,000 ceppi completamente caratterizzati), che permetterà la classificazione di alcuni isolati a livello di specie, compresi i collegamenti ai numeri di adesione genBank quando disponibili.
IDBac è open source e il codice è disponibile per chiunque per personalizzare le proprie esigenze di analisi e visualizzazione dei dati. Consigliamo agli utenti di consultare un vasto corpo di letteratura (Sauer et al.7, Silva et al.5) per aiutare a sostenere e progettare i loro obiettivi sperimentali. Ospitiamo un forum di discussione all'indirizzo: https://groups.google.com/forum/#!forum/idbac e un mezzo per segnalare problemi con il software all'indirizzo: https://github.com/chasemc/IDBacApp/issues.
Gli autori non hanno nulla da rivelare.
Questo lavoro è stato supportato dal National Institute of General Medical Sciences Grant R01 GM125943, National Geographic Grant CP-044R-17; Fondo di ricerca islandese sovvenzione 152336-051; e l'Università dell'Illinois presso i fondi per le startup di Chicago. Inoltre, ringraziamo i seguenti collaboratori: Dr. Amanda Bulman per l'assistenza con i parametri di acquisizione delle proteine MALDI-TOF MS; Dr. Terry Moore e Dr. Atul Jain per ricrystallizzare la matrice di acido alfa-ciano-4-idrossicininnamiche (CHCA).
Name | Company | Catalog Number | Comments |
Acetonitrile | Fisher | 60-002-65 | LC-MS Ultra CHROMASOLV |
Autoflex Speed LEF MALDI-TOF instrument | Bruker Daltonics | ||
Bruker Daltonics Bacterial test standard | Fisher | NC0884024 | Bruker Daltonics 8604530 |
Bruker Peptide Calibration standard | Fisher | NC9846988 | Bruker Daltonics 8206195 |
Formic Acid | Fisher Chemical | A117-50 | 99.5+%, Optima LC/MS Grade |
MALDI-TOF target Plate | Bruker Daltonics | ||
Methanol | Fisher Chemical | A456-500 | Optima LC/MS Grade |
Toothpicks | any is ok | ||
Trifluoroacetic acid | Fisher | AC293810010 | 99.5%, for biochemistry, ACROS Organics |
Water | VWR | 7732-18-5 | LC-MS |
α-Cyano-4-hydroxycinnamic acid | Sigma | 28166-41-8 | (C2020-25G) ≥98% (TLC), powder |
Richiedi autorizzazione per utilizzare il testo o le figure di questo articolo JoVE
Richiedi AutorizzazioneThis article has been published
Video Coming Soon