Method Article
IDBac est un pipeline bioinformatique à base de spectrométrie de masse open source qui intègre des données provenant à la fois de protéines intactes et de spectres de métabolites spécialisés, recueillis sur des matériaux cellulaires extraits de colonies bactériennes. Le pipeline permet aux chercheurs d'organiser rapidement des centaines à des milliers de colonies bactériennes en groupes taxonomiques putatifs, et de les différencier davantage en fonction de la production spécialisée de métabolites.
Afin de visualiser la relation entre la phylogénie bactérienne et la production spécialisée de métabolites des colonies bactériennes poussant sur l'agar nutritif, nous avons développé IDBac-une desorption/ionisation laser à faible coût et à haut débit spectrométrie de masse en temps de vol (MALDI-TOF MS) pipeline bioinformatique. Le logiciel IDBac est conçu pour les non-experts, est disponible gratuitement, et capable d'analyser quelques à des milliers de colonies bactériennes. Ici, nous présentons des procédures pour la préparation des colonies bactériennes pour l'analyse mS MALDI-TOF, l'opération des instruments de SP, et le traitement et la visualisation des données dans IDBac. En particulier, nous instruisons les utilisateurs comment regrouper les bactéries en dendrogrammes à partir d'empreintes digitales protéiques de la SP et créons de manière interactive les réseaux d'associations de métabolites (MN) à partir de données spécialisées sur les métabolites.
Un obstacle majeur pour les chercheurs qui étudient la fonction bactérienne est la capacité d'évaluer rapidement et simultanément l'identité taxonomique d'un micro-organisme et sa capacité à produire des métabolites spécialisés. Cela a empêché des progrès significatifs dans la compréhension de la relation entre la phylogénie bactérienne et la production spécialisée de métabolites dans la majorité des bactéries isolées de l'environnement. Bien que les méthodes basées sur la SP qui utilisent des empreintes digitales protéiques pour regrouper et identifier les bactéries soient bien décrites1,2,3,4, ces études ont généralement été réalisées sur de petits groupes d'isolats, d'une manière spécifique à l'espèce. Fait important, l'information sur la production spécialisée de métabolites, un moteur majeur de la fonction microbienne dans l'environnement, n'a pas été incorporée dans ces études. Silva et coll.5 ont récemment fourni un historique complet détaillant la sous-utilisation de MALDI-TOF MS pour analyser les métabolites spécialisés et la pénurie de logiciels pour soulager les goulots d'étranglement actuels en bioinformatique. Afin de remédier à ces lacunes, nous avons créé IDBac, un pipeline bioinformatique qui intègre à la fois les modes linéaires et réfléchissants de MALDI-TOF MS6. Cela permet aux utilisateurs de visualiser et de différencier rapidement les isolats bactériens à partir de protéines et de métabolites spécialisés, respectivement, les empreintes digitales de la SP.
IDBac est rentable, à haut débit, et conçu pour l'utilisateur laïc. Il est disponible gratuitement (chasemc.github.io/IDBac), et ne nécessite l'accès qu'à un spectromètre de masse MALDI-TOF (le mode réflecteur sera nécessaire pour l'analyse spécialisée des métabolites). La préparation de l'échantillon repose sur la méthode simple de « transfert direct étendu »7,8 et les données sont recueillies avec des acquisitions linéaires et réfléchissantes consécutives sur un seul point MALDI-cible. Avec IDBac, il est possible d'analyser la phylogénie putative et la production spécialisée de métabolites de centaines de colonies en moins de quatre heures, y compris la préparation d'échantillons, l'acquisition de données et la visualisation des données. Ceci présente un avantage significatif de temps et de coût sur les méthodes traditionnelles d'identification des bactéries (telles que le séquençage de gène), et d'analyse de la sortie métabolique (spectrométrie de masse de chromatographie liquide [LCMS] et méthodes chromatographiques semblables).
À l'aide de données obtenues dans le cadre d'une analyse linéaire en mode, IDBac utilise un clusterhiérarchique pour représenter la parenté des spectres protéiques. Étant donné que les spectres représentent principalement des protéines ribosomal ionisées, ils fournissent une représentation de la diversité phylogénétique présente dans un échantillon. En outre, IDBac intègre des données en mode réflecteur pour afficher des empreintes digitales spécialisées métabolites sous forme de metabolite Association Networks (MANs). Les MAN sont des réseaux bipartites qui permettent une visualisation facile de la production de métabolites partagée et unique entre les isolats bactériens. La plate-forme IDBac permet aux chercheurs d'analyser à la fois les données protéiques et les métabolites spécialisés en tandem, mais aussi individuellement si un seul type de données est acquis. Fait important, IDBac traite les données brutes des instruments Bruker et Xiamen, ainsi que txt, onglet, csv, mzXML et mzML. Cela élimine le besoin de conversion manuelle et de mise en forme des ensembles de données, et réduit considérablement le risque d'erreur de l'utilisateur ou de mauvaise manipulation des données De SP.
1. Préparation de la matrice MALDI
2. Préparation des plaques cibles MALDI
REMARQUE: Voir Sauer et al.7, pour plus de détails.
Figure 1 : plaque MALDI-cible montrant deux isolats différents avant d'ajouter l'acide formique et la matrice MALDI (top 3 taches - Bacillus sp.; bas 3 taches - Streptomyces sp.). Pour les deux, la colonne 3 représente l'échantillon excédentaire; la colonne 2 représente la quantité appropriée d'échantillon; la colonne 1 représente un échantillon insuffisant pour l'analyse MALDI. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.
3. Acquisition de données
REMARQUE : Les paramètres généraux pour l'acquisition de données sont énumérés dans le tableau 1.
paramètre | protéine | Metabolite spécialisé |
Mass Start (Da) | en 1920 | 60 Annonces |
Fin de masse (Da) | en 21000 | 2700 Annonces |
Déviation de masse (Da) | en 1900 | 50 Annonces |
Coups | 500 Annonces | 1000 |
Fréquence (Hz) | En 2000 | En 2000 |
Taille laser | en liberté | taille moyenne |
MaxStdDev (ppm) | 300 Ans et plus | 30 Ans, états-unis ( |
Tableau 1.
Figure 2 : Exemple de spectres protéiques affichant l'effet de la modification de la puissance laser et du gain du détecteur. La qualité spectrale est la meilleure dans le panneau A, et diminue jusqu'à ce que la qualité insuffisante des spectres dans les panneaux C et D. Bien que le spectre du panneau B puisse entraîner des pics utilisables, le panneau A affiche des données optimales. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.
Figure 3 : Exemple de spectres de métabolites spécialisés affichant l'effet de modifier la puissance laser et le gain de détecteur. La qualité spectrale est la meilleure dans le panneau A et diminue jusqu'à ce que la qualité des spectres insuffisante s'insinvace dans les panneaux C et D. Bien que le spectre du panneau B puisse entraîner des pics utilisables, le panneau A affiche des données optimales. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.
4. Nettoyage de la plaque cible MALDI (adapté de Sauer et al.7)
5. Installation du logiciel IDBac
6. En commençant par les données brutes
REMARQUE : Des explications détaillées et des instructions de chaque étape de traitement des données sont intégrées dans IDBac, mais les principales analyses et entrées interactives sont décrites ci-dessous.
Figure 4 : Étape de conversion et de prétraitement des données IDBac. IDBac convertit les spectres bruts dans le format mzML ouvert et stocke mzML, les listes de pointe et les informations d'échantillon dans une base de données pour chaque expérience. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.
7. Travailler avec des expériences précédentes
Figure 5 : Page « Travailler avec des expériences antérieures ». Utilisez la page « Travailler avec des expériences antérieures » d'IDBac pour sélectionner une expérience à analyser ou à modifier. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.
Figure 6 : Informations sur l'échantillon d'entrée. Dans la page "Travailler avec des expériences antérieures" les utilisateurs peuvent entrer des informations sur des échantillons tels que l'identité taxonomique, l'emplacement de la collecte, les conditions d'isolement, etc. S'il vous plaît cliquez ici pour voir une version plus grande de ce chiffre.
Figure 7 : Transférer des données. La page « Travailler avec des expériences antérieures » contient la possibilité de transférer des données entre les expériences existantes et les nouvelles expériences. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.
8. Mise en place de l'analyse des données protéiques et création de parcelles miroirs
Figure 8 : Choisissez la façon dont les pics sont conservés pour analyse. Après avoir sélectionné une expérience à analyser, la visite de la page « Analyse des données protéinées » et l'ouverture ultérieure du menu « Choisissez comment les pics sont retenus pour l'analyse » permettent aux utilisateurs de choisir des paramètres comme le rapport signal-bruit pour la rétention des pics. L'intrigue miroir affichée (ou dendrogramme) sera automatiquement mise à jour pour refléter les paramètres choisis. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.
9. Regrouper des échantillons à l'aide de données protéiques
Figure 9 : Sélectionnez les échantillons de l'expérience choisie pour les inclure dans le dendrogramme affiché. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.
10. Personnalisation du dendrogramme protéique
Figure 10 : Ajustez le dendrogramme. IDBac fournit quelques options pour modifier l'apparence du dendrogramme, ceux-ci peuvent être trouvés dans le menu "Ajuster le Dendrogram". Cela comprend les branches de coloration et les étiquettes par k-moyens, ou en " coupant" le dendrogramme à une hauteur fournie par l'utilisateur. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.
Figure 11 : Incorporez des informations sur les échantillons. Dans le menu "Ajuster le Dendrogram" est l'option "Incorporez des informations sur les échantillons". La sélection de ce projet permettra de tracer des informations sur des échantillons à côté du dendrogramme. L'exemple d'information est entré dans la page « Travailler avec des expériences antérieures ». Veuillez cliquer ici pour voir une version plus grande de ce chiffre.
11. Insérer des échantillons d'une expérience distincte dans le dendrogramme
Figure 12 : Insérez des échantillons d'un autre menu d'expérience. Parfois, il est utile de comparer des échantillons d'une autre expérience. Utilisez le menu « Insérer des échantillons d'une autre expérience » pour choisir des échantillons à inclure dans le dendrogramme actuellement affiché. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.
12. Analyse des données spécialisées sur les métabolites et les réseaux d'associations de métabolites (NAM)
Figure 13 : Page d'analyse des données sur les petites molécules. Si un dendrogramme a été créé à partir de spectres protéiques, il sera affiché dans la page « Analyse des données des petites molécules ». Cette page affichera également les réseaux associés de métabolites (AMN) et l'analyse des composants de principe (PCA) pour les données de petites molécules. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.
13. Partage de données
Nous avons analysé six souches de Micromonospora chokoriensis et deux souches de Bacillus subtilis, qui étaient auparavant caractérisées6, en utilisant des données disponibles à DOI: 10.5281/zenodo.2574096. Suivant les instructions dans l'onglet Démarrage avec données brutes, nous avons sélectionné l'option Cliquez ici pour convertir les fichiers Bruker et suivi les instructions fournies par IDBac pour chaque jeu de données (Figure 14).
Une fois les étapes automatisées de conversion et de prétraitement/pic, nous avons procédé à la création d'une nouvelle expérience combinée IDBac en transférant des échantillons des deux expériences dans une seule expérience contenant à la fois Bacillus et Échantillons de micromonosopora (figure 15). L'analyse qui en a résulté a consisté à comparer les spectres protéiques à l'aide de parcelles miroirs, telles qu'illustrées à la figure 16, ce qui a été utile pour évaluer la qualité des spectres et ajuster les paramètres de pic-picking. Figure 17 affiche une capture d'écran des résultats de regroupement de protéines avec les paramètres par défaut sélectionnés. Le dendrogramme a été coloré en ajustant le seuil sur l'intrigue (apparaît comme une ligne pointillée). Il convient de noter la séparation claire entre les genres, avec à la fois M. chokoriensis et B. subtilis isole groupage séparément.
Figure 18, Figure 19, et Figure 20 mettent en évidence la capacité de générer des NAM de régions sélectionnées par l'utilisateur en cliquant et en faisant glisser à travers le dendrogramme de protéines. Avec cela, nous avons été en mesure de créer rapidement DES NMA pour comparer seulement les souches B. subtilis (Figure 18), seulement les souches de M. chokoriensis (Figure 19), et toutes les souches simultanément (Figure 20). La fonction principale de ces réseaux est de fournir aux chercheurs une vue d'ensemble du degré de chevauchement des métabolites spécialisés entre les bactéries. Avec ces données en main, les chercheurs ont maintenant la capacité de prendre des décisions éclairées à partir seulement d'une petite quantité de matériel gratté à partir d'une colonie bactérienne.
Figure 14 : Traitement spectral. Les spectres autoFlex Bruker téléchargés ont été convertis et traités à l'aide d'IDBac. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.
Figure 15 : Expérience combinée IDBac. Étant donné que les spectres Micromonospora et Bacillus ont été recueillis sur différentes plaques cibles MALDI, les deux expériences ont ensuite été combinées en une seule expérience - "Bacillus-Micromonsopora". Cela a été fait dans l'onglet "Travailler avec des expériences antérieures", en suivant les instructions dans le menu "Transférer des échantillons d'expériences précédentes à de nouvelles /autres expériences". Veuillez cliquer ici pour voir une version plus grande de ce chiffre.
Figure 16 : Comparaison. Les spectres De Micromonspora et Bacillus ont été comparés à l'aide des parcelles miroirs de la page « Analyse des données protéiques ». En fin de compte, les paramètres de pointe par défaut ont été choisis. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.
Figure 17 : Regroupement hiérarchique. Le clustering hiérarchique, à l'aide de paramètres par défaut, a correctement regroupé les isolats Bacillus et Micromonospora. Le dendrogramme a été coloré en « coupant » le dendrogramme à une hauteur arbitraire (affichée comme une ligne pointillée) et 100 bootstraps utilisés pour montrer la confiance dans la ramification. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.
Figure 18 : L'homme créé en sélectionnant les souches de Bacillus sp. du dendrogramme protéique a montré une production différentielle de métabolitesspécialisés. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.
Figure 19 : L'homme créé en sélectionnant les six souches de Micromonospora sp. du dendrogramme protéique a montré la production différentielle de métabolites spécialisés. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.
Figure 20 : MAN de Bacillus sp. et Micromonospora sp. souches montrant une production différentielle de métabolites spécialisés. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.
Le protocole IDBac détaille l'acquisition et l'analyse de données de métabolites spécialisés de jusqu'à 384 isolats bactériens en 4 h par un seul chercheur. Avec IDBac il n'est pas nécessaire d'extraire l'ADN des isolats bactériens ou de générer des extraits spécialisés de métabolites à partir de bouillons de fermentation liquide et de les analyser à l'aide de méthodes chromatographiques. Au lieu de cela, les données de protéine et de métabolite spécialisés sont rassemblées en répandant simplement le matériel des colonies bactériennes directement sur une plaque cible de MALDI. Cela réduit considérablement le temps et le coût associés à des techniques alternatives telles que le séquençage du gène 16S rRNA et LCMS9.
Il est important d'ajouter une matrice vierge et des taches d'étalonnage à la plaque MALDI, et nous recommandons d'utiliser un nombre approprié de répliques pour assurer la reproductibilité et la confiance statistique. Le nombre de répliques dépendra de l'expérience. Par exemple, si un utilisateur a l'intention de différencier des milliers de colonies d'une collection de plaques de diversité environnementale, moins de répliques peuvent être nécessaires (notre laboratoire recueille trois répliques techniques par colonie). Alternativement, si un utilisateur souhaite créer une base de données personnalisée de souches de taxons bactériens spécifiques pour déterminer rapidement les classifications sous-espèces d'isolats inconnus, alors d'autres répliques sont appropriées (notre laboratoire recueille huit répliques biologiques par souche).
IDBac est un outil permettant de différencier rapidement les isolats bactériens hautement liés à partir d'informations taxonomiques présumées et de la production spécialisée de métabolites. Il peut compléter ou servir de précurseur à des méthodes orthogonales telles que des analyses génétiques approfondies, des études impliquant la production et la fonction des métabolites, ou la caractérisation de la structure spécialisée des métabolites par spectroscopie par résonance magnétique nucléaire et/ou LC-MS/MS.
La production spécialisée de métabolites (IDBac MANs) est très sensible aux conditions de croissance bactérienne, en particulier en utilisant différents médias, ce qui est une limitation potentielle de la méthode. Toutefois, ces traits peuvent être exploités par l'utilisateur, car IDBac peut facilement générer des NMA montrant les différences dans la production spécialisée de métabolites dans une variété de conditions de croissance. Il est important de noter que même si les empreintes digitales spécialisées des métabolites peuvent varier selon l'état de croissance, nous avons déjà montré que les empreintes digitales protéiques demeurent relativement stables entre ces variables (voir Clark et coll.6). Lorsqu'il s'agit de plaques de diversité environnementale, nous recommandons de purifier les isolats bactériens avant l'analyse afin de réduire les contributions possibles des cross-talk bactériens voisins.
Enfin, l'absence d'une base de données publique consultable sur les empreintes digitales protéiques de la SP est une lacune majeure dans l'utilisation de cette méthode pour classer les bactéries environnementales inconnues. Nous avons créé IDBac dans cet esprit, et inclus la conversion automatisée des données dans un format open-source accepté par la communauté (mzML)10,11,12 et conçu le logiciel pour permettre la recherche, le partage et la création de bases de données personnalisées. Nous sommes en train de créer une grande base de données publique (10 000 souches entièrement caractérisées), qui permettra la classification de certains isolats au niveau de l'espèce, y compris des liens vers les numéros d'adhésion de GenBank lorsqu'ils seront disponibles.
IDBac est open source et le code est disponible pour tout le monde pour personnaliser leurs besoins d'analyse de données et de visualisation. Nous recommandons aux utilisateurs de consulter un vaste corpus de littérature (Sauer et al.7, Silva et coll.5) pour les aider à soutenir et à concevoir leurs objectifs expérimentaux. Nous organisons un forum de discussion à: https://groups.google.com/forum/#!forum/idbac et un moyen de signaler les problèmes avec le logiciel à: https://github.com/chasemc/IDBacApp/issues.
Les auteurs n'ont rien à révéler.
Ce travail a été soutenu par national Institute of General Medical Sciences Grant R01 GM125943, National Geographic Grant CP-044R-17; Subvention du Fonds islandais de recherche 152336-051; et l'Université de l'Illinois à Chicago fonds de démarrage. De plus, nous remercions les contributeurs suivants : Dr Amanda Bulman pour son aide aux paramètres d'acquisition de protéines MALDI-TOF MS; Dr Terry Moore et Dr Atul Jain pour recrystallizing alpha-cyano-4-hydroxycinnamic acid matrix (CHCA).
Name | Company | Catalog Number | Comments |
Acetonitrile | Fisher | 60-002-65 | LC-MS Ultra CHROMASOLV |
Autoflex Speed LEF MALDI-TOF instrument | Bruker Daltonics | ||
Bruker Daltonics Bacterial test standard | Fisher | NC0884024 | Bruker Daltonics 8604530 |
Bruker Peptide Calibration standard | Fisher | NC9846988 | Bruker Daltonics 8206195 |
Formic Acid | Fisher Chemical | A117-50 | 99.5+%, Optima LC/MS Grade |
MALDI-TOF target Plate | Bruker Daltonics | ||
Methanol | Fisher Chemical | A456-500 | Optima LC/MS Grade |
Toothpicks | any is ok | ||
Trifluoroacetic acid | Fisher | AC293810010 | 99.5%, for biochemistry, ACROS Organics |
Water | VWR | 7732-18-5 | LC-MS |
α-Cyano-4-hydroxycinnamic acid | Sigma | 28166-41-8 | (C2020-25G) ≥98% (TLC), powder |
Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE
Demande d’autorisationThis article has been published
Video Coming Soon