Method Article
IDBacは、細菌コロニーから掻き取られた細胞材料に収集された、無傷のタンパク質と特殊な代謝スペクトルの両方からのデータを統合するオープンソースの質量分析ベースのバイオインフォマティクスパイプラインです。このパイプラインにより、研究者は数百から数千の細菌コロニーを種置分類群に迅速に組織し、特殊な代謝産物生産に基づいてそれらをさらに区別することができます。
栄養寒天で増殖する細菌コロニーの細菌系統と特殊な代謝産物産生との関係を可視化するために、低コストで高スループットのマトリックス支援レーザー脱着/イオン化を実現するIDBacを開発しました。飛行時間質量分析(MALDI-TOF MS)バイオインフォマティクスパイプライン。IDBacソフトウェアは、非専門家のために設計されており、自由に利用可能であり、細菌のコロニーの数〜数千を分析することができます。ここでは、MALDI-TOF MS解析、MS計測器の操作、IDBacにおけるデータ処理と可視化のための細菌コロニーの調製手順を紹介する。特に、タンパク質MS指紋に基づいて細菌をデンドログラムにクラスター化する方法をユーザーに指示し、特殊な代謝産物データから代謝物アソシエーションネットワーク(MAN)をインタラクティブに作成する方法を指示します。
細菌機能を研究する研究者の主な障壁は、微生物の分類的アイデンティティと特殊な代謝産物を生産する能力を迅速かつ同時に評価する能力です。これは、細菌の系統と環境から分離された細菌の大部分における特殊な代謝産物産生との関係を理解する上で重要な進歩を防いだ。タンパク質フィンガープリントを用いて細菌を同定するMSベースの方法は、1、2、3、4についてよく説明されているが、これらの研究は一般的に、単離物の小群で行われている。種固有の方法で。重要なのは、環境における微生物機能の主要な推進要因である特殊代謝産物産生に関する情報は、これらの研究に組み込まれないままである。Silva et al.5は最近、MALDI-TOF MSの使用不足を詳細に説明し、専門の代謝産物を分析し、現在のバイオインフォマティクスのボトルネックを解消するためのソフトウェアの不足を詳述した包括的な歴史を提供した。これらの欠点に対処するために、MALDI-TOF MS6の線形モードとリフレクトロン モードの両方を統合するバイオインフォマティクス パイプラインである IDBac を作成しました。これにより、ユーザーはタンパク質と特殊な代謝産物MS指紋の両方に基づいて細菌単離物を迅速に視覚化し、区別することができます。
IDBac は、コスト効率が高く、スループットが高く、レイ ユーザー向けに設計されています。それは自由に利用できる(chasemc.github.io/IDBac)、MALDI-TOF質量分析計へのアクセスだけを要求する(リフレクターモードは、特殊な代謝産物分析のために必要とされる)。サンプル調製は、単純な「拡張直接転写」方法7、8に依存し、データは単一のMALDIターゲットスポット上で連続した線形および反射ロンの獲得で収集される。IDBacを使用すると、サンプル調製、データ取得、データビジュアライゼーションなど、数百のコロニーの植物学および特殊な代謝産物の生産を4時間以内に分析することが可能です。これは、細菌(遺伝子シーケンシングなど)を同定し、代謝出力(液体クロマトグラフィー質量分析法[LCMS]および同様のクロマトグラフィー法)を分析する従来の方法に比べて、かなりの時間とコストの優位性を提示します。
線形モード解析で得られたデータを使用して、IDBacはタンパク質スペクトルの関連性を表すために階層クラスタリングを採用しています。スペクトルは主にイオン化リボソームタンパク質を表すので、サンプル中に存在する系統的多様性の表現を提供する。さらに、IDBacは、代謝物アソシエーションネットワーク(MAN)として特殊な代謝物指紋を表示するためにリフレクターモードデータを組み込んでいます。MANは、細菌単離物間の共有およびユニークな代謝産物産生を容易に視覚化することを可能にするバイパルティネットワークです。IDBacプラットフォームにより、研究者はタンパク質と特殊な代謝産物データの両方を並行して分析できますが、1つのデータタイプのみが取得された場合は個別に分析できます。重要なのは、IDBac は Bruker および Xiamen インストゥルメントの生データ、および txt、タブ、csv、mzXML、および mzML から生データを処理することです。これにより、データ・セットの手動変換と書式設定が不要になり、ユーザー・エラーや MS データの誤った処理のリスクが大幅に軽減されます。
1. マルディマトリックスの調製
2. MALDIターゲットプレートの調製
注:詳細については、ザウアーら7を参照してください。
図1:ギ酸およびMALDIマトリックスを添加する前に2つの異なる単離物を示すMALDI標的プレート(上3箇所 -バチルスsp.;下3スポット-連鎖膿菌sp.)。どちらの場合も、列3は過剰なサンプルを表します。列2は、適切な量のサンプルを表します。列1は、MALDI 分析のサンプルが不十分です。この図のより大きなバージョンを表示するには、ここをクリックしてください。
3. データ取得
注: データ取得の一般的なパラメータは、表 1に示されています。
パラメーター | タンパク質 | 特殊代謝産物 |
マススタート (Da) | 1920年 | 60歳 |
マスエンド (Da) | 21000年 | 2700年 |
質量偏向 (Da) | 1900年 | 50歳 |
ショット | 500名 | 1000年 |
周波数(Hz) | 2000年 | 2000年 |
レーザーサイズ | 大きな | 媒体 |
マックスストドデブ (ppm) | 300人 | 30歳 |
表 1.
図 2:レーザーパワーおよび検出器ゲインを修飾する効果を示すタンパク質スペクトルの例。スペクトル品質はパネルAに最適であり、パネルCとDのスペクトル品質が不十分になるまで減少します。パネルBのスペクトルは使用可能なピークをもたらすかもしれませんが、パネルAは最適なデータを表示します。この図のより大きなバージョンを表示するには、ここをクリックしてください。
図 3:レーザーパワーおよび検出器ゲインを修飾する効果を示す特殊な代謝スペクトルを例とする。スペクトル品質はパネルAに最適であり、パネルCとDのスペクトル品質が不十分になるまで減少します。パネルBのスペクトルは使用可能なピークをもたらすかもしれませんが、パネルAは最適なデータを表示します。この図のより大きなバージョンを表示するには、ここをクリックしてください。
4. MALDIターゲットプレートのクリーニング(ザウアーら7から適応)
5. IDBacソフトウェアのインストール
6. 生データから始める
注: 各データ処理ステップの詳細な説明と手順は IDBac 内に埋め込まれていますが、主な分析と対話式入力については以下に説明します。
図 4: IDBac データ変換および前処理ステップ。IDBac は、未加工スペクトルを開いている mzML 形式に変換し、各実験のデータベースに mzML、ピーク リスト、およびサンプル情報を格納します。この図のより大きなバージョンを表示するには、ここをクリックしてください。
7. 以前の実験を行う
図 5: 「以前の実験を行う」ページ。IDBac の「以前の実験を使用する」ページを使用して、分析または変更する実験を選択します。この図のより大きなバージョンを表示するには、ここをクリックしてください。
図 6: サンプル情報を入力します。「以前の実験で作業」ページ内では、分類のアイデンティティ、収集場所、隔離条件などのサンプルに関する情報を入力できます。
図 7: データの転送。[以前の実験を使用して作業する] ページには、既存の実験と新しい実験の間でデータを転送するオプションが含まれています。この図のより大きなバージョンを表示するには、ここをクリックしてください。
8. タンパク質データ解析の設定とミラープロットの作成
図 8: 解析のためにピークを保持する方法を選択します。分析する実験を選択した後、「タンパク質データ分析」ページにアクセスし、「分析のためにピークを保持する方法を選択する」メニューを開くと、ピークを保持するための信号対雑音比などの設定を選択できます。表示されたミラープロット(またはデンドログラム)は、選択した設定を反映するように自動的に更新されます。この図のより大きなバージョンを表示するには、ここをクリックしてください。
9. タンパク質データを用いてサンプルをクラスタリングする
図 9: 選択した実験からサンプルを選択し、表示されたデンドログラム内に含めます。この図のより大きなバージョンを表示するには、ここをクリックしてください。
10. タンパク質デンドログラムのカスタマイズ
図 10:デンドログラムを調整します。IDBacは、デンドログラムがどのように見えるかを変更するためのいくつかのオプションを提供し、これらはメニュー「デンドログラムを調整」内で見つけることができます。これには、k 平均による分岐とラベルの色付け、またはユーザーが提供する高さでデンドログラムを「切断」する色付けが含まれます。この図のより大きなバージョンを表示するには、ここをクリックしてください。
図 11: サンプルに関する情報を組み込む。「デンドログラムを調整する」メニューには、「サンプルに関する情報を組み込む」オプションがあります。これを選択すると、デンドログラムの横にサンプルに関する情報をプロットできます。サンプル情報は、「以前の実験を使用して作業」ページ内で入力されます。この図のより大きなバージョンを表示するには、ここをクリックしてください。
11. 別の実験のサンプルをデンドログラムに挿入する
図 12: 別の実験メニューからサンプルを挿入します。別の実験のサンプルを比較すると便利な場合があります。「別の実験からサンプルを挿入」メニューを使用して、現在表示されているデンドログラム内に含めるサンプルを選択します。この図のより大きなバージョンを表示するには、ここをクリックしてください。
12. 特殊代謝産物データと代謝関連ネットワークの解析(MAN)
図13:小分子データ分析」ページ。デンドログラムがタンパク質スペクトルから作成された場合、「低分子データ分析」ページに表示されます。このページでは、低分子データの代謝アソシテネットワーク(MAN)と原理成分分析(PCA)も表示されます。この図のより大きなバージョンを表示するには、ここをクリックしてください。
13. データの共有
DOIで入手可能なデータを用いて、以前に特徴づけられた6株のマイクロモノスポラチョコリエンシスと2株のバチルス・サチリスを分析した: 10.5281/zenodo.2574096.[生データを使用して開始] タブの指示に従って、[ここをクリック] を選択して Bruker ファイルを変換し、各データセットに対して IDBac が提供する手順に従います (図 14)。
自動変換と前処理/ピークピーク時のステップが完了した後、我々は、2つの実験からサンプルをバチルスと両方を含む単一の実験に移すことによって、新しい組み合わせIDBac実験を作成し、新しい複合IDBac実験を作成しました。マイクロモノソポラサンプル(図15)。結果として得られた分析では、図16に描かれたミラープロットを用いたタンパク質スペクトルの比較が含まれており、これはスペクトル品質の評価とピークピッキング設定の調整に役立ちました。図 17は、既定の設定が選択されたタンパク質 クラスタリング結果のスクリーンショットを表示します。デンドログラムは、プロットのしきい値を調整することによって色分けされました(点線で表示されます)。注目すべきは、M.チョコリエンシスとB.サブティリスの両方が別々にクラスタリングを分離して、属間の明確な分離である。
図 18、図 19、および図 20は、タンパク質デンドログラムをクリックしてドラッグして、ユーザーが選択した領域の MAN を生成する機能を強調表示します。これにより、B.サブティリス株(図18)、M.チョコリエンシス株(図19)、およびすべての株を同時に比較するMANを迅速に作成することができました(図20)。これらのネットワークの主な機能は、細菌間の特殊な代謝産物の重複の程度の広範な概要を研究者に提供することです。これらのデータを手にして、研究者は細菌のコロニーから削り取られた少量の材料から情報に基づいた意思決定を行う能力を持つようになりました。
図14:スペクトル処理。ダウンロードしたBruker autoFlexスペクトルは、IDBacを使用して変換および処理されました。この図のより大きなバージョンを表示するには、ここをクリックしてください。
図15:組み合わせたIDBac実験。マイクロモノスポラとバチルススペクトルは異なるMALDIターゲットプレート上で収集されたため、2つの実験は、その後、単一の実験に組み合わされました-「バチルス_マイクロモンソポラ」。これは「以前の実験で作業する」タブで行われ、メニュー「以前の実験から新しい/他の実験にサンプルを転送する」の指示に従って行われました。この図のより大きなバージョンを表示するには、ここをクリックしてください。
図 16: 比較。マイクロモンスポラとバチルススペクトルを「タンパク質データ分析」ページ内のミラープロットを用いて比較した。最終的に、デフォルトのピーク設定が選択されました。この図のより大きなバージョンを表示するには、ここをクリックしてください。
図 17: 階層クラスタリング。階層クラスタリングは、デフォルト設定を使用して、正しくグループ化されたBacillusとMicromonospora分離。デンドログラムは、任意の高さでデンドログラムを「切断」し(破線として表示)、分岐に自信を示すために使用される100のブートストラップによって着色されました。この図のより大きなバージョンを表示するには、ここをクリックしてください。
図18:タンパク質デンドログラムからバチルスsp.株を選択して作成されたMANは、特殊代謝産物の微分産生を示した。この図のより大きなバージョンを表示するには、ここをクリックしてください。
図19:タンパク質デンドログラムから6つのマイクロモノスポラsp.株を選択して作成されたMANは、特殊な代謝産物の微分産生を示した。この図のより大きなバージョンを表示するには、ここをクリックしてください。
図20:特殊代謝産物の微分産生を示すバチルス属およびマイクロモノスポラ属株のMAN。この図のより大きなバージョンを表示するには、ここをクリックしてください。
IDBacプロトコルは、細菌タンパク質と特殊な代謝産物データの取得と分析を1人の研究者によって4時間で最大384の細菌単離物の詳細に説明します。IDBacを使用すると、細菌分離からDNAを抽出したり、液体発酵ブロスから特殊な代謝物抽出物を生成し、クロマトグラフィー法を使用してそれらを分析する必要はありません。代わりに、タンパク質と特殊な代謝産物データは、細菌コロニーからMALDIターゲットプレートに直接材料を広げることによって収集されます。これにより、16S rRNA遺伝子シーケンシングやLCMS 9などの代替技術に関連する時間とコストが大幅に削減されます。
MALDIプレートにマトリックスブランクとキャリブレーションスポットを追加することが重要であり、再現性と統計的な信頼性を確保するために適切な数の反復を使用することをお勧めします。反復数は実験に依存します。たとえば、ユーザーが何千ものコロニーを環境ダイバーシティプレートのコレクションから区別する場合、必要な複製数が少なくなる可能性があります(当研究室では、コロニーごとに 3 つの技術的な反復を収集します)。あるいは、ユーザーが特定の細菌タキサから株のカスタムデータベースを作成して未知の単離物の亜種分類を迅速に決定したい場合、より多くの複製が適切です(私たちの研究室は、1回あたり8つの生物学的反復を収集します)ひずみ)。
IDBacは、栄養分類情報と特殊な代謝産物生産に基づいて、関連性の高い細菌単離物を迅速に分離するためのツールです。これは、詳細な遺伝子解析、代謝物の産生と機能を含む研究、核磁気共鳴分光法による特殊な代謝物構造の特性解析などの直交法の前駆体として機能することができます。LC-MS/MS
特殊な代謝産物産生(IDBac MAN)は、細菌の増殖条件、特に異なる培地を使用して、この方法の潜在的な制限である可能性があります。しかし、IDBacは様々な成長条件下で特殊な代謝産物産生の違いを示すMANを容易に生成することができるので、これらの特性は、ユーザーによって利用される可能性があります。特殊な代謝産物の指紋は成長条件によって異なる可能性がありますが、タンパク質フィンガープリントはこれらの変数にわたって比較的安定していることを以前に示しました(Clark et al.6を参照)。環境ダイバーシティプレートを扱う場合は、近隣の細菌クロストークからの寄与を減らすために、分析前に細菌単離物を精製することをお勧めします。
最後に、タンパク質MSフィンガープリントの検索可能なパブリックデータベースの欠如は、未知の環境細菌を分類するためにこの方法を使用する上で大きな欠点です。これを念頭に置いてIDBacを作成し、コミュニティが受け入れるオープンソース形式(mzML)10、11、12へのデータの自動変換を含み、検索、共有、および作成を可能にするソフトウェアを設計しました。カスタム データベース。私たちは、大規模なパブリックデータベース(>10,000完全に特徴付けられた株)を作成中で、利用可能な場合はGenBankの加盟番号へのリンクを含む種レベルへの一部の分離物の分類を可能にします。
IDBac はオープン ソースであり、データ分析と視覚化のニーズをカスタマイズできるユーザーがコードを使用できます。我々は、ユーザーが彼らの実験目標をサポートし、設計するのを助けるために文献の広範なボディを参照することをお勧めします (Sauer et al.7, Silva et al.5)私たちは、ディスカッションのためのフォーラムを主催しています: https://groups.google.com/forum/#!forum/idbacとソフトウェアに関する問題を報告する手段: https://github.com/chasemc/IDBacApp/issues.
著者は何も開示していない。
この研究は、国立一般医学研究所グラントR01 GM125943、ナショナルジオグラフィックグラントCP-044R-17によってサポートされました。アイスランド研究基金助成金 152336-051;そして、シカゴのスタートアップファンドでイリノイ大学。また、以下の貢献者に感謝します: アマンダ・ブルマン博士は、MALDI-TOF MSタンパク質取得パラメータの支援を受けました。テリー・ムーア博士とアトゥル・ジャイン博士は、α-シアノ-4-ヒドロキシシナミン酸マトリックス(CHCA)を再結晶化した。
Name | Company | Catalog Number | Comments |
Acetonitrile | Fisher | 60-002-65 | LC-MS Ultra CHROMASOLV |
Autoflex Speed LEF MALDI-TOF instrument | Bruker Daltonics | ||
Bruker Daltonics Bacterial test standard | Fisher | NC0884024 | Bruker Daltonics 8604530 |
Bruker Peptide Calibration standard | Fisher | NC9846988 | Bruker Daltonics 8206195 |
Formic Acid | Fisher Chemical | A117-50 | 99.5+%, Optima LC/MS Grade |
MALDI-TOF target Plate | Bruker Daltonics | ||
Methanol | Fisher Chemical | A456-500 | Optima LC/MS Grade |
Toothpicks | any is ok | ||
Trifluoroacetic acid | Fisher | AC293810010 | 99.5%, for biochemistry, ACROS Organics |
Water | VWR | 7732-18-5 | LC-MS |
α-Cyano-4-hydroxycinnamic acid | Sigma | 28166-41-8 | (C2020-25G) ≥98% (TLC), powder |
このJoVE論文のテキスト又は図を再利用するための許可を申請します
許可を申請This article has been published
Video Coming Soon
Copyright © 2023 MyJoVE Corporation. All rights reserved