Method Article
IDBac ist eine Open-Source-Pipeline für Massenspektrometrie, die Daten sowohl aus intakten Proteinen als auch aus spezialisierten Metabolitenspektren integriert, die auf Zellmaterial gesammelt werden, das aus Bakterienkolonien abgekratzt wurde. Die Pipeline ermöglicht es Forschern, schnell Hunderte bis Tausende von Bakterienkolonien in vermeintliche taxonomische Gruppen zu organisieren und sie auf der Grundlage der spezialisierten Metabolitenproduktion weiter zu differenzieren.
Um die Beziehung zwischen bakterieller Phylogenie und spezialisierter Metabolitenproduktion von Bakterienkolonien, die auf Nährstoffagar wachsen, zu visualisieren, haben wir IDBac entwickelt – eine kostengünstige und hochdurchsatzbasierte Matrix-unterstützte Laserdesorption/Ionisierung. Zeit-des-Flug-Massenspektrometrie (MALDI-TOF MS) Bioinformatik-Pipeline. IDBac Software ist für Nicht-Experten entwickelt, ist frei verfügbar, und in der Lage, ein paar bis Tausende von Bakterienkolonien zu analysieren. Hier stellen wir Verfahren zur Vorbereitung von Bakterienkolonien für die MALDI-TOF MS-Analyse, MS-Instrumentenbedienung sowie Datenverarbeitung und Visualisierung in IDBac vor. Insbesondere weisen wir Anwender an, Bakterien auf Basis von Protein-MS-Fingerabdrücken in Dendrogramme zu gruppieren und interaktiv Metabolite Association Networks (MANs) aus spezialisierten Metabolitendaten zu erstellen.
Ein großes Hindernis für Forscher, die die bakterielle Funktion untersuchen, ist die Fähigkeit, schnell und gleichzeitig die taxonomische Identität eines Mikroorganismus und seine Fähigkeit zur Herstellung spezialisierter Metaboliten zu bewerten. Dies hat signifikante Fortschritte beim Verständnis der Beziehung zwischen bakterieller Phylogenie und spezialisierter Metabolitenproduktion in der Mehrheit der aus der Umwelt isolierten Bakterien verhindert. Obwohl MS-basierte Methoden, die Protein-Fingerabdrücke verwenden, um Bakterien zu gruppieren und zu identifizieren, gut beschrieben sind1,2,3,4, wurden diese Studien im Allgemeinen an kleinen Gruppen von Isolaten durchgeführt, artspezifisch. Wichtig ist, dass Informationen über die spezialisierte Metabolitenproduktion, ein wichtiger Treiber der mikrobiellen Funktion in der Umwelt, in diesen Studien nicht berücksichtigt wurden. Silva et al.5 lieferten vor kurzem eine umfassende Geschichte, die die Unternutzung von MALDI-TOF MS zur Analyse spezialisierter Metaboliten und den Mangel an Software zur Linderung aktueller Bioinformatik-Engpässe detailliert darlegte. Um diese Mängel zu beheben, haben wir IDBac geschaffen, eine Bioinformatik-Pipeline, die sowohl lineare als auch reflekronische Modi von MALDI-TOF MS6integriert. Dies ermöglicht es Benutzern, bakterielle Isolate schnell zu visualisieren und zu unterscheiden, die sowohl auf Protein- als auch auf spezialisierten Metaboliten-MS-Fingerabdrücken basieren.
IDBac ist kostengünstig, mit hohem Durchsatz und für den Laienbenutzer konzipiert. Es ist frei verfügbar (chasemc.github.io/IDBac) und erfordert nur Zugriff auf ein MALDI-TOF-Massenspektrometer (für die spezielle Metabolitenanalyse ist ein Reflekronmodus erforderlich). Die Probenvorbereitung basiert auf der einfachen Methode der "erweiterten direkten Übertragung"7,8 und die Daten werden mit aufeinanderfolgenden linearen und reflekronischen Erfassungen an einem einzigen MALDI-Zielpunkt gesammelt. Mit IDBac ist es möglich, die vermeintliche Phylogenie und spezialisierte Metabolitenproduktion von Hunderten von Kolonien in weniger als vier Stunden zu analysieren, einschließlich Probenvorbereitung, Datenerfassung und Datenvisualisierung. Dies stellt einen erheblichen Zeit- und Kostenvorteil gegenüber herkömmlichen Methoden zur Identifizierung von Bakterien (z. B. Gensequenzierung) und zur Analyse des metabolischen Outputs (Flüssigchromatographie-Massenspektrometrie [LCMS] und ähnliche chromatographische Methoden) dar.
Mithilfe von Daten, die in der Linearmodusanalyse gewonnen wurden, verwendet IDBac hierarchisches Clustering, um die Verwandtheit von Proteinspektren darzustellen. Da die Spektren meist ionisierte ribosomale Proteine darstellen, bieten sie eine Darstellung der phylogenetischen Vielfalt, die in einer Probe vorhanden ist. Darüber hinaus enthält IDBac Daten im Reflectron-Modus, um spezielle Metaboliten-Fingerabdrücke als Metabolit-Assoziationsnetzwerke (MANs) anzuzeigen. MANs sind zweiteilige Netzwerke, die eine einfache Visualisierung der gemeinsamen und einzigartigen Metabolitenproduktion zwischen bakteriellen Isolaten ermöglichen. Die IDBac-Plattform ermöglicht es Forschern, sowohl Protein- als auch spezialisierte Metabolitendaten im Tandem, aber auch einzeln zu analysieren, wenn nur ein Datentyp erfasst wird. Wichtig ist, dass IDBac Rohdaten von Bruker- und Xiamen-Instrumenten sowie txt, tab, csv, mzXML und mzML verarbeitet. Dadurch entfällt die manuelle Konvertierung und Formatierung von Datensätzen und das Risiko von Benutzerfehlern oder falscher Verarbeitung von MS-Daten wird erheblich reduziert.
1. Herstellung der MALDI-Matrix
2. Herstellung von MALDI-Zielplatten
HINWEIS: Siehe Sauer et al.7, für weitere Details.
Abbildung 1: MALDI-Zielplatte mit zwei verschiedenen Isolaten vor Zugabe von Ameisensäure und MALDI-Matrix (obere 3 Flecken - Bacillus sp.; unten 3 Flecken - Streptomyces sp.). Für beide stellt Spalte 3 eine überschüssige Stichprobe dar. Spalte 2 stellt die entsprechende Menge an Stichproben dar; Spalte 1 stellt eine unzureichende Stichprobe für die MALDI-Analyse dar. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
3. Datenerfassung
HINWEIS: Die allgemeinen Parameter für die Datenerfassung sind in Tabelle 1aufgeführt.
Parameter | protein | Spezialisierter Metabolit |
Massenstart (Da) | 1920 | 60 |
Massenende (Da) | 21000 | 2700 |
Massenverformung (Da) | 1900 | 50 |
Aufnahmen | 500 | 1000 |
Frequenz (Hz) | 2000 | 2000 |
Lasergröße | groß | mittel |
MaxStdDev (ppm) | 300 | 30 |
Tabelle 1.
Abbildung 2: Beispiel-Proteinspektren, die den Effekt der Änderung der Laserleistung und der Detektorverstärkung anzeigen. Spectra-Qualität ist am besten in Panel Aund verringert sich bis unzureichende Spektrenqualität in den Panels C und D. Während das Spektrum in Panel B zu verwendbaren Spitzen führen kann, zeigt Panel A optimale Daten an. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Abbildung 3: Beispiel spezialisierte Metabolitenspektren, die den Effekt der Änderung der Laserleistung und der Detektorverstärkung anzeigen. Die Spektrenqualität ist in Panel A am besten und verringert sich bis zur unzureichenden Spektrenqualität in den Panels C und D. Während das Spektrum in Panel B zu verwendbaren Spitzen führen kann, zeigt Panel A optimale Daten an. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
4. Reinigung der MALDI Zielplatte (angepasst von Sauer et al.7)
5. Installieren der IDBac-Software
6. Beginnend mit Rohdaten
HINWEIS: Detaillierte Erläuterungen und Anweisungen zu jedem Datenverarbeitungsschritt sind in IDBac eingebettet, die Hauptanalysen und interaktiven Eingaben werden jedoch im Folgenden beschrieben.
Abbildung 4: IDBac-Datenkonvertierungs- und Vorverarbeitungsschritt. IDBac konvertiert Raw-Spektren in das offene mzML-Format und speichert mzML, Spitzenlisten und Beispielinformationen in einer Datenbank für jedes Experiment. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
7. Arbeiten mit früheren Experimenten
Abbildung 5: Seite "Arbeiten mit früheren Experimenten". Verwenden Sie die Seite "Arbeiten mit früheren Experimenten" von IDBac, um ein Zuanalyse- oder Änderungsexperiment auszuwählen. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Abbildung 6: Eingabe von Beispielinformationen. Auf der Seite "Arbeiten mit früheren Experimenten" können Benutzer Informationen zu Beispielen wie taxonomische Identität, Sammelort, Isolationsbedingungen usw. eingeben. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Abbildung 7: Übertragen von Daten. Die Seite "Arbeiten mit früheren Experimenten" enthält die Möglichkeit, Daten zwischen bestehenden Experimenten und zu neuen Experimenten zu übertragen. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
8. Einrichten von Proteindatenanalysen und Erstellen von Spiegeldiagrammen
Abbildung 8: Wählen Sie aus, wie Spitzen für die Analyse beibehalten werden. Nach der Auswahl eines zu analysierenden Experiments können Benutzer auf der Seite "Proteindatenanalyse" und anschließend das Menü "Wählen, wie Peaks für die Analyse beibehalten werden" Einstellungen wie das Signal-Rausch-Verhältnis für die Beibehaltung von Spitzen auswählen. Das angezeigte Spiegeldiagramm (oder Dendrogramm) wird automatisch aktualisiert, um die ausgewählten Einstellungen widerzuspiegeln. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
9. Clustering-Proben mit Proteindaten
Abbildung 9: Wählen Sie Beispiele aus dem ausgewählten Experiment aus, die in das angezeigte Dendrogramm aufgenommen werden sollen. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
10. Anpassen des Proteindendrogramms
Abbildung 10: Passen Sie das Dendrogramm an. IDBac bietet einige Optionen zum Ändern, wie das Dendrogramm aussieht, diese können im Menü "Anpassen des Dendrogramms" gefunden werden. Dazu gehören das Färben von Ästen und Beschriftungen mit k-Mitteln oder durch "Schneiden" des Dendrogramms in einer vom Benutzer bereitgestellten Höhe. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Abbildung 11: Integrieren von Informationen zu Beispielen. Im Menü "Das Dendrogramm anpassen" befindet sich die Option "Informationen über Samples integrieren". Wenn Sie diese Option auswählen, können Sie Informationen zu Samples neben dem Dendrogramm zeichnen. Beispielinformationen werden auf der Seite "Arbeiten mit früheren Experimenten" eingegeben. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
11. Fügen Sie Proben aus einem separaten Experiment in das Dendrogramm ein
Abbildung 12: Einfügen von Beispielen aus einem anderen Experimentmenü. Manchmal ist es hilfreich, Proben aus einem anderen Experiment zu vergleichen. Verwenden Sie das Menü "Samples aus einem anderen Experiment einfügen", um Beispiele auszuwählen, die in das aktuell angezeigte Dendrogramm aufgenommen werden sollen. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
12. Analyse spezialisierter Metabolitendaten und Metaboliten-Assoziationsnetzwerke (MANs)
Abbildung 13: Seite "Kleinmoleküldatenanalyse". Wenn ein Dendrogramm aus Proteinspektren erstellt wurde, wird es auf der Seite "Kleine Moleküldatenanalyse" angezeigt. Auf dieser Seite werden auch Metabolite Associate Networks (MANs) und Principle Components Analysis (PCA) für kleine Moleküldaten angezeigt. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
13. Gemeinsame Nutzung von Daten
Wir analysierten sechs Stämme von Micromonospora Chokoriensis und zwei Stämme von Bacillus subtilis, die zuvor charakterisiert wurden6, mit Daten zur Verfügung doI: 10.5281/zenodo.2574096. Folgende Anweisungen auf der Registerkarte Start mit Rohdaten haben wir die Option Klicken Sie hier, um Bruker-Dateien zu konvertieren, ausgewählt und den von IDBac bereitgestellten Anweisungen für jedes Dataset gefolgt (Abbildung 14).
Nachdem die automatisierteKonvertierung und die Vorverarbeitung/Spitzenschritte abgeschlossen waren, machten wir einen neuen kombinierten IDBac-Experiment, indem wir Proben aus den beiden Experimenten in ein einziges Experiment übertrugen, das sowohl Bacillus als auch Mikromonosopora-Proben (Abbildung 15). Die resultierende Analyse umfasste den Vergleich von Proteinspektren mithilfe von Spiegeldiagrammen, wie in Abbildung 16dargestellt, was für die Bewertung der Spektrenqualität und das Anpassen von Spitzenauswahleinstellungen nützlich war. Abbildung 17 zeigt einen Screenshot der Proteinclustering-Ergebnisse mit ausgewählten Standardeinstellungen. Das Dendrogramm wurde durch Anpassen des Schwellenwerts auf dem Diagramm (erscheint als gepunktete Linie) eingefärbt. Bemerkenswert ist die klare Trennung zwischen Gattungen, mit M. chokoriensis und B. subtilis isoliert Clustering getrennt.
Abbildung 18, Abbildung 19und Abbildung 20 unterstreichen die Möglichkeit, MANs von vom Benutzer ausgewählten Regionen zu generieren, indem Sie auf das Proteindendrogramm klicken und es ziehen. Damit konnten wir schnell MANs erstellen, um nur die B. subtilis Stämme zu vergleichen (Abbildung 18), nur die M. chokoriensis Stämme (Abbildung 19), und alle Stämme gleichzeitig (Abbildung 20). Die primäre Funktion dieser Netzwerke besteht darin, den Forschern einen umfassenden Überblick über den Grad der spezialisierten Metabolitenüberlappung zwischen Bakterien zu geben. Mit diesen Daten in der Hand haben die Forscher nun die Fähigkeit, fundierte Entscheidungen aus nur einer kleinen Menge an Material zu treffen, das aus einer Bakterienkolonie abgekratzt wurde.
Abbildung 14: Spectra-Verarbeitung. Heruntergeladene Bruker autoFlex Spektren wurden mit IDBac konvertiert und verarbeitet. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Abbildung 15: Kombiniertes IDBac-Experiment. Da die Spektren Micromonospora und Bacillus auf verschiedenen MALDI-Zielplatten gesammelt wurden, wurden die beiden Experimente anschließend zu einem einzigen Experiment -"Bacillus_Micromonsopora" zusammengefasst. Dies geschah im Bereich "Arbeiten mit früheren Experimenten" nach Anweisungen im Menü "Proben aus früheren Experimenten auf neue/andere Experimente übertragen". Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Abbildung 16: Vergleich. Mikromonspora- und Bacillus-Spektren wurden anhand der Spiegeldiagramme auf der Seite "Proteindatenanalyse" verglichen. Letztendlich wurden Standard-Spitzeneinstellungen ausgewählt. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Abbildung 17: Hierarchisches Clustering. Hierarchisches Clustering, mit Standardeinstellungen, korrekt gruppiert Bacillus und Micromonospora Isolate. Das Dendrogramm wurde durch "Schneiden" des Dendrogramms in beliebiger Höhe (angezeigt als gestrichelte Linie) und 100 Bootstraps, die verwendet wurden, um Vertrauen in verzweigte Zuzweigungen zu zeigen, eingefärbt. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Abbildung 18: MAN erstellt durch die Auswahl der Bacillus sp. Stämme aus dem Protein Dendrogramm zeigte Differentialproduktion von spezialisierten Metaboliten. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Abbildung 19: MAN entstand durch die Auswahl der sechs Micromonospora sp. Stämme aus dem Protein Dendrogramm zeigte differentiale Produktion von spezialisierten Metaboliten. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Abbildung 20: MAN von Bacillus sp. und Micromonospora sp. Stämmen, die eine differenzielle Produktion von spezialisierten Metaboliten zeigen. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Das IDBac-Protokoll beschreibt die Erfassung und Analyse von bis zu 384 bakteriellen Isolaten in 4 h durch einen einzigen Forscher. Mit IDBac ist es nicht notwendig, DNA aus bakteriellen Isolaten zu extrahieren oder spezielle Metabolitenextrakte aus flüssigen Fermentationsbrühen zu erzeugen und sie mit chromatographischen Methoden zu analysieren. Stattdessen werden Protein- und spezialisierte Metabolitendaten gesammelt, indem Material aus Bakterienkolonien einfach direkt auf eine MALDI-Zielplatte verteilt wird. Dies reduziert den Zeit- und Kostenaufwand für alternative Techniken wie 16S rRNA-Gensequenzierung und LCMS9erheblich.
Es ist wichtig, der MALDI-Platte einen Matrixrohling und Kalibrierflecken hinzuzufügen, und wir empfehlen die Verwendung einer geeigneten Anzahl von Replikationen, um Reproduzierbarkeit und statistisches Vertrauen zu gewährleisten. Die Anzahl der Replikationen ist experimentabhängig. Wenn ein Benutzer beispielsweise beabsichtigt, Tausende von Kolonien von einer Sammlung von Umweltdiversitätsplatten zu unterscheiden, können weniger Replikationen erforderlich sein (unser Labor sammelt drei technische Replikationen pro Kolonie). Wenn ein Benutzer eine benutzerdefinierte Datenbank mit Stämmen aus bestimmten bakteriellen Taxa erstellen möchte, um schnell Unterartenklassifikationen unbekannter Isolate zu bestimmen, dann sind weitere Replikationen angebracht (unser Labor sammelt acht biologische Replikationen pro Dehnung).
IDBac ist ein Werkzeug zur schnellen Differenzierung hochverwandter bakterienisolate auf der Grundlage vermeintlicher taxonomischer Informationen und spezialisierter Metabolitenproduktion. Es kann orthogonale Methoden wie eingehende genetische Analysen, Studien mit Metabolitenproduktion und -funktion oder die Charakterisierung der spezialisierten Metabolitenstruktur durch Kernspinresonanzspektroskopie und/oder LC-MS/MS.
Die spezialisierte Metabolitenproduktion (IDBac MANs) ist sehr anfällig für bakterielle Wachstumsbedingungen, insbesondere mit verschiedenen Medien, was eine potenzielle Einschränkung der Methode darstellt. Diese Eigenschaften können jedoch vom Benutzer ausgenutzt werden, da IDBac leicht MANs erzeugen kann, die die Unterschiede in der spezialisierten Metabolitenproduktion unter einer Vielzahl von Wachstumsbedingungen zeigen. Es ist wichtig zu beachten, dass zwar spezialisierte Metaboliten-Fingerabdrücke je nach Wachstumsbedingung variieren können, wir aber zuvor gezeigt haben, dass Protein-Fingerabdrücke über diese Variablen hinweg relativ stabil bleiben (siehe Clark et al.6). Im Umgang mit Umweltdiversitätsplatten empfehlen wir, bakterielle Isolate vor der Analyse zu reinigen, um mögliche Beiträge aus benachbarten bakteriellen Quergesprächen zu reduzieren.
Schließlich ist das Fehlen einer durchsuchbaren öffentlichen Datenbank mit Protein-MS-Fingerabdrücken ein großes Manko bei der Verwendung dieser Methode zur Klassifizierung unbekannter Umweltbakterien. Wir haben IDBac in diesem Sinne erstellt und die automatisierte Konvertierung von Daten in ein von der Community akzeptiertes Open-Source-Format (mzML)10,11,12 integriert und die Software so konzipiert, dass das Suchen, Teilen und Erstellen von benutzerdefinierte Datenbanken. Wir sind dabei, eine große öffentliche Datenbank (>10.000 voll charakterisierte Stämme) zu erstellen, die die Klassifizierung einiger Isolate auf Artenebene ermöglicht, einschließlich Links zu GenBank-Beitrittsnummern, wenn verfügbar.
IDBac ist Open Source und der Code ist für jedermann verfügbar, um seine Datenanalyse- und Visualisierungsanforderungen anzupassen. Wir empfehlen den Benutzern, eine umfangreiche Literatur (Sauer et al.7, Silva et al.5) zu konsultieren, um ihre experimentellen Ziele zu unterstützen und zu entwerfen. Wir veranstalten ein Diskussionsforum unter: https://groups.google.com/forum/#!forum/idbac und eine Möglichkeit, Probleme mit der Software zu melden unter: https://github.com/chasemc/IDBacApp/issues.
Die Autoren haben nichts zu verraten.
Diese Arbeit wurde vom National Institute of General Medical Sciences Grant R01 GM125943, National Geographic Grant CP-044R-17 unterstützt; Zuschuss des isländischen Forschungsfonds 152336-051; und University of Illinois at Chicago Startup Funds. Außerdem danken wir den folgenden Mitwirkenden: Dr. Amanda Bulman für die Unterstützung bei den Parametern für den Erwerb von MALDI-TOF MS-Proteinen; Dr. Terry Moore und Dr. Atul Jain zur Rekristallisation von Alpha-Cyano-4-Hydroxycinnamic acid matrix (CHCA).
Name | Company | Catalog Number | Comments |
Acetonitrile | Fisher | 60-002-65 | LC-MS Ultra CHROMASOLV |
Autoflex Speed LEF MALDI-TOF instrument | Bruker Daltonics | ||
Bruker Daltonics Bacterial test standard | Fisher | NC0884024 | Bruker Daltonics 8604530 |
Bruker Peptide Calibration standard | Fisher | NC9846988 | Bruker Daltonics 8206195 |
Formic Acid | Fisher Chemical | A117-50 | 99.5+%, Optima LC/MS Grade |
MALDI-TOF target Plate | Bruker Daltonics | ||
Methanol | Fisher Chemical | A456-500 | Optima LC/MS Grade |
Toothpicks | any is ok | ||
Trifluoroacetic acid | Fisher | AC293810010 | 99.5%, for biochemistry, ACROS Organics |
Water | VWR | 7732-18-5 | LC-MS |
α-Cyano-4-hydroxycinnamic acid | Sigma | 28166-41-8 | (C2020-25G) ≥98% (TLC), powder |
Genehmigung beantragen, um den Text oder die Abbildungen dieses JoVE-Artikels zu verwenden
Genehmigung beantragenThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Alle Rechte vorbehalten