この包括的なプロトコルは、多様な尿細菌の近いゲノムを生成する方法を指示し、コーディング経験のない読者が端末ベースのゲノム組み立てと分析パイプラインを正常に実装できるようにします。完全なゲノムアセンブリは、コメンサルおよび泌尿器病原性細菌の間でコロニー形成および病原性に寄与する遺伝子の発見を可能にする。近いゲノムは、ゲノムアーキテクチャと移動遺伝子要素に関する洞察を提供します。
ハイブリッドゲノムアセンブリ法は、他の解剖学的部位または環境ニッチから分離された任意の耕用細菌に適用して、ゲノムコンテンツおよびアーキテクチャに同様の洞察を提供することができる。プロトコルとメーカーガイドに従って、二本鎖DNAプールを準備し、DNAプールに常磁性ビーズの2.5倍の体積を加え、チューブを軽くフリックして内容物を混ぜてクリーンアップします。サンプルをGの2,000倍で簡単に回転させ、室温で5分間回転子にサンプルを置き、次にビーズを磁石にペレットします。
次に、ペレットを邪魔することなく、作りたての70%エタノールをヌクレアーゼを含まない水で250マイクロリットルで2回洗浄します。打つ間磁石の上に管を残します。各洗浄後にエタノールを吸引し、その後、サンプルをGの2,000倍に短く回転させ、磁石に戻します。
残留エタノールをピペットオフし、ペレットを30秒間乾燥させます。乾燥したら、60〜70マイクロリットルのヌクレアーゼを含まない水でペレットを再懸濁し、試料を室温で2分間インキュベートし、次いで、ペレット状のペレットを磁石にペレット状にします。エリュートをきれいな1.5ミリリットルのマイクロ遠心分離チューブに移します。
濃縮された二本鎖DNAプールをフルオロメーターで定量化し、65マイクロリットルの最終体積で700ナノグラムのサンプルのアリコートを準備し、アダプタライゲーションステップに進み、最初の実行が終了した後の2回目の実行のためにプールの残りの部分を摂氏4度に保持します。メーカーの指示に従ってアダプターのライゲーションを続行します。シーケンス処理を続行するには、プライミングバッファーを混合し、フローセルをプライミングします。
DNAライブラリ溶液を準備し、サンプルをドロップワイズでローディングポートにロードします。シーケンス実行を開始します。シーケンス用のオペレーティング・ソフトウェアを開き、開始ボタンをクリックして、実験の名前を入力します。
キットの選択に進み、使用する適切なライブラリ準備キットとバーコード拡張パックを選択し、[続行] をクリックしてオプションを実行します。2 回目の実行に十分なライブラリを準備する場合は、実行時間をデフォルトの 72 時間から 48 時間に調整し、ベースコールを続けます。構成高速ベースコールでベース呼び出しオプションを確認します。
バーコードを有効に設定して、出力 FASTQ がバーコードシーケンスから切り取られ、バーコードに基づいて別々のディレクトリにデマルチプレクスされるようにします。出力を続行するをクリックします。次に、出力シーケンスデータを保存する場所を選択します。
FAST5 出力を保存する場合は、FASTQ 出力と 500 ギガバイトを超えるデータを保存するだけの場合は、約 30 ~ 50 ギガバイトのデータを想定してください。シーケンス処理後に手動フィルタリングを続行する場合は、フィルタリングオプション Qscore 7 の読み取り長未フィルターのチェックを外します。それ以外の場合は、オプションをオンのままにします。
セットアップ タブの実行に進み、すべての設定を確認してください。設定が正しい場合は、スタートボタンをクリックします。それ以外の場合は、[戻る] をクリックして必要な調整を行います。
long 読み取りディレクトリで、実行で使用される各バーコード用の新しいディレクトリを作成します。各バーコードに対応するすべての fastq ファイルを適切なフォルダにコピーします。各実行から各バーコードのすべてのfastqファイルを結合します。
ファイルを結合したら、ターミナルを開き、cd コマンドを使用して long ディレクトリ内のバーコードディレクトリに移動します。バーコードごとの fastq ファイルを 1 つの fastq ファイルに連結するには、コマンドを実行し、各バーコードに対して手順を繰り返します。NanoStat を使用して、コマンドを実行してサンプルの読み取り品質を評価し、後で参照するために出力をテキストまたは Word ファイルにコピーして結果を記録します。
結果が保存された後、NanoFilt を使用して MinION 読み取りをフィルター処理し、コマンドを実行して Q が 7 未満、長さが 200 未満の読み取りを破棄します。生成されたトリミングされたファイルで、コマンドを使用して NanoStat を実行します。出力をテキストまたは Word ファイルにコピーして結果を記録し、前の結果と比較して、フィルタが正常に実行されたことを確認します。
シーケンス実行で使用する各バーコードに対して、この手順を繰り返します。ハイブリッドゲノムアセンブリを生成するには、短い読み取りファイルと長い読み取りファイルをtrimmed_readsという名前の単一のディレクトリに整理します。そのため、ディレクトリには以前に生成された fastq が含まれています。
トリミングされた長い読み取りと2つのfastqのためのgzファイル。gz ファイルは R1 と R2 で、短い読み取りがトリミングされます。端末の cd コマンドを使用して、読み取りファイルを格納するディレクトリー trimmed_readsにナビゲートします。
正しいディレクトリに入ったら、2つの短い読み取りファイルを zip にして fastq に保存します。gz フォーマットは、コマンドを実行して行います。R1 と R2 の両方について、この手順を繰り返します。すべての読み取りファイルが fastq にあることを確認します。
gz フォーマットし、すべてのファイルが同じ分離ファイルと一致することを確認します。コマンドを実行して、ユニサイクラーを使用してハイブリッド アセンブリを開始します。実行が完了したら、一輪車を確認します。
エラーがないことを確認するログ ファイル。生成されたコンテキストの数、サイズ、および完了または不完全な状況を記録します。不完全なコンテキストがユニサイクラーログで識別された場合は、コマンドにフラグを追加して、ユニサイクラーを太字モードで再実行します。
包帯を開いてファイルをクリックし、ロードグラフを選択してアセンブリを選択します。以前にユニサイクラーによって生成されたunicycler_output_directoryに保存された gfa ファイル。ファイルがロードされたら、左側のツールバーの[グラフの描画]ボタンをクリックし、コンティグがどのように接続され、編成されているかを調べることによって、アセンブリが完成しているかどうかを評価します。
cd コマンドを使用して、ターミナル内でユニサイクラー出力を保存するフォルダに移動します。次に、コマンドを実行して quast プロトコルを実行します。出力ディレクトリquast_output_directoryで quast によって生成されたレポートを確認します。
cd コマンドを使用してユニサイクラー出力を保存するフォルダにターミナル内を移動し、コマンドを実行して prokka を実行します。tsv テーブルを開き、生成された gff ファイルをシーケンス解析ソフトウェアにアップロードして、注釈を確認します。ソフトウェアの注釈を視覚化および分析します。
代表的なゲル画像では、ゲノムDNAまたはgDNA抽出結果が描かれています。無傷のgDNAの抽出と分離が成功することが観察できる。断片化したgDNAおよびRNA汚染を示す抽出が失敗することも描かれている。
細菌のゲノムアセンブリグラフは、ユニサイクラーハイブリッドデノボアセンブリによって生成され、包帯によって視覚化された。クレブシエラオキシトカKoPF10の完全なゲノムは、単一の閉じた染色体を実証し、クレブシエラ肺炎の完全なゲノムKpPF25は閉じた染色体と5つの閉じたプラスミドで構成されていました。クレブシエラ肺炎の不完全な染色体KpPF46は、2つの相互接続されたコンティグで構成されていました。
ジェネリアスプライムがクレブシエラオキシトカKoPF10およびクレブシエラ肺炎のKpPF25の完全なゲノムのために生成したアセンブリマップは、プラスミドの骨格に沿って色付きの矢印で示されるアノタイズされた遺伝子を示した。フローセルのロードが正常に行われていることを確認するには、推奨設定を使用して長い読み取りをフィルタリングし、すべてのファイルが fastq に含まれるようにします。gz フォーマット。
同じサンプルに属するファイルを使用して、正しいユニサイクラーコマンドを実行します。