Method Article
我々は、ナノポアシーケンシングプラットフォーム上でアンプリコンベースの全ゲノムウストゥウイルス(USUV)シーケンシングのプロトコルを検証した。ここでは、ナノポアR10フローセルの誤差率をより詳細に用いた方法について説明する。
全ゲノムシーケンシングは、ウイルスの流行を特徴付け、追跡するために使用することができます。ナノポアベースの全ゲノムシーケンシングプロトコルは、いくつかの異なるウイルスについて説明されている。これらのアプローチは、特定のウイルスまたは遺伝的に関連するウイルスのグループを標的にするために使用することができる重複するアンプリコンベースのアプローチを利用する。ウイルスの存在の確認に加えて、シーケンシングはゲノム疫学研究に使用され、ウイルスを追跡し、起源、貯水池および伝染様式を解明することができる。このようなアプリケーションでは、使用するプラットフォームに関連するエラー率の影響を理解することが重要です。臨床および公衆衛生の設定での日常的な適用は、プロトコルのすべての重要な変更と文書化されている必要があります。以前は、全ゲノムのミウストゥウイルスシーケンシング用プロトコルが、イルミナシーケンシングと直接比較して検証(R9.4フローセル)であった。ここでは、R10フローセルとイルミナシーケンシングの比較を例として用いて、必要な読み込みカバレッジを決定するために使用される方法を説明する。
第3世代シーケンス技術の急速な発展により、ウイルスの発生時にリアルタイムシーケンシングに近い方向に進みます。この遺伝情報のタイムリーな入手可能性は、ウイルス病原体の起源および進化を決定するのに役立つ可能性がある。しかし、次世代シーケンシングの分野におけるゴールドスタンダードは、依然として第2世代のシーケンサーです。これらの技術は、エマルジョン PCR またはクローン ブリッジ増幅中のクローン増幅のような特定の時間のかかる技術に依存します。第3世代のシーケンサーは安価で手持ち型で、簡略化されたライブラリ調製方法論が付属しています。特に、シーケンスデバイスの小型化と購入価格の低さは、展開可能でフィールド可能なシーケンシングの興味深い候補となります。これは、例えばシエラレオネでのエボラウイルス,の流行の間に、そしてブラジル1、2、32で進行中のアルボ1ウイルスの流行調査の間に見ることができました。ただし、報告された高エラー率4は、ナノポアシーケンスを使用できるアプリケーションを制限する可能性があります。
ナノポアシーケンシングは急速に進化しています。新製品は定期的に市場で入手可能です。この例としては、例えばDNA分子の両鎖のシーケンシングを可能にする1D二乗キットであり、それによって、ポア6内の2つの異なるインスタンスで電流の変化を測定する呼び出された塩基5の精度とR10フローセルの発達を高める。さらに、ベースコールの改善のような改善されたバイオインフォマティクスツールは、ベースコール7の精度を向上させます。最も頻繁に使用されるベースコールの1つ(例えば、アルバコア)は、9ヶ月の期間5で少なくとも12回更新されています。最近、メーカーはまた、デフォルトのナノポアソフトウェア8に実装されているフリップフロップと呼ばれる新しいベースコールをリリースしました。これらの改善はすべて、より正確なシーケンスにつながり、ナノポアシーケンサーのエラー率を低下させます。
ウストゥウイルス(USUV)は、家族のフラビビリダ科の蚊媒介性アルボウイルスであり、約11,000ヌクレオチドの陽性鎖RNAゲノムを有する。USUVは主に大きな灰色のフクロウとブラックバード99、1010に影響を与えますが、他の鳥種もUSUV感染の影響を受けやすい11です。最近、USUVはげっ歯類や抜け目で同定されたが、ウイルスの感染における潜在的な役割は不明であるが12.ヒトにおいて、無症候性感染症は、血液供与者13、14、15、1614,15に記載されているが、USUV16感染も脳炎または髄膜炎脳炎1317、18,18に関連していると報告されている。オランダでは、USUVは2016年10年に野鳥で初めて検出され、2018年には無症候性の献血者で14.USUVの最初の検出以来、発生は、その後の年の間に報告されており、全ゲノムシーケンシングを含む監視は、以前はナイーブな集団におけるアルボウイルスの出現と広がりを監視するために現在進行中です。
エボラウイルス、ジカウイルスおよび黄熱病ウイルス3、19、20,20などの他のウイルスについて説明3,されているものと同様に、全長USUV21をシーケンスするプライマーセットを開発した。このポリメラーゼ連鎖反応(PCR)ベースのアプローチにより、サンプル中の脳サンプルのような高度に宿主汚染されたサンプルタイプから、約32のCt値までの全長USUVゲノムの回収が可能になります。アンプリコンベースのシーケンシングアプローチの利点は、メタゲノムシーケンシングと比較して高感度と高い特異性です。アンプリコンベースのアプローチを使用する場合の制限は、配列がすべての株に適合するプライマーを設計するために類似する必要があり、プライマーはウイルスの多様性に関する現在の知識に基づいて設計されることです。
第3世代シーケンシングの絶え間ない発展と改善を考えると、シーケンサーのエラー率を定期的に評価する必要があります。ここでは、USUVを例に用いて、イルミナシーケンシングに対してナノポアの性能を直接評価する方法について述べている。このメソッドは最新の R10 フロー セルで生成されたシーケンスに適用され、ベースコールはフリップフロップベース呼び出し元の最新バージョンで実行されます。
注: 使用するソフトウェア ツールの一覧: usearch v11.0.667;筋肉 v3.8.1551;ポレチョップ 0.2.4;カットアダプト2.5;ミニマップ2 2.16-r922;サムツール 1.9;トリミング 0.39;bbmap 38.33;スペード v3.13.1;kma-1.2.8
1. プライマー設計
2. マルチプレックス PCR
3. ナノポアデータからコンセンサス配列を生成するデータ解析
4. イルミナデータの解析
5. イルミナデータをゴールドスタンダードとして使用するナノポアシーケンシングのエラープロファイルを補正するために必要な読み込みカバレッジを決定する
最近、フローセルバージョン(R10)の新しいバージョンがリリースされ、電子電流信号をDNA配列(いわゆるフリップフロップベース発信者)に変換するために使用されるベース発信者に改良が加えられた。したがって、我々は、以前R9.4フローセル上およびイルミナミセック器具21上で配列されたUSUV陽性フクロウの脳組織からUSUVを再配列した。ここでは、Illumina シーケンシングと直接比較することにより、信頼できるコンセンサス呼び出しに必要な読み取りカバレッジを決定するために使用する方法について説明します。
ベースコールフリップフロップと組み合わせて新しいフローセルを使用すると、40倍の読み取りカバレッジがIlluminaシーケンスと比較して同じ結果になるということが示されます。30倍の読み取りカバレッジは0.0002%のエラー率をもたらし、配列化された585,000個のヌクレオチドごとに1つの誤差に相当し、20倍の読み取りカバレッジは配列化された63,529ヌクレオチドごとに1つのエラーをもたらします。10xの読み取りカバレッジは、配列化された3,312個のヌクレオチドごとに1つのエラーをもたらし、完全なUSUVゲノムあたり3ヌクレオチド以上が間違っていると呼ばれていることを意味します。読み取りカバレッジが 30 倍を超える場合、インデルは見られなかった。20倍の読み取りカバレッジは1つのインデルポジションを検出し、10倍の読み取りカバレッジは29のポジションでインデルをもたらしました。異なる読み取りカバレッジのカットオフを使用したエラー率の概要を表 1に示します。
カバレッジ | エラーの反復 1 | エラー率の反復 1 | インデル: | エラーの反復 2 | エラー率の反復 2 | インデル: | エラーの反復 3 | エラー率の反復 3 | インデル: |
10× | 100 | 0.0274% | 4 | 116 | 0.0297% | 18 | 110 | 0.0282% | 7 |
20× | 4 | 0.0010% | 0 | 6 | 0.0015% | 1 | 7 | 0.0018% | 0 |
30倍 | 2 | 0.0005% | 0 | 0 | 0.0000% | 0 | 0 | 0.0000% | 0 |
40倍 | 0 | 0.0000% | 0 | 0 | 0.0000% | 0 | 0 | 0.0000% | 0 |
50× | 0 | 0.0000% | 0 | 0 | 0.0000% | 0 | 0 | 0.0000% | 0 |
表1:ナノポアシーケンシングの誤差率の概要各反復は、1000 個のランダム サンプルを表します。
補足ファイル 1: ランダム選択。このファイルを表示するには、ここをクリックしてください (右クリックしてダウンロードしてください)。
ナノポアシーケンシングは絶えず進化しているため、エラー率を監視する方法が必要です。ここでは、ナノポアシーケンサーのエラー率を監視するワークフローについて説明します。これは、新しいフローセルのリリース後、またはベースコールの新しいリリースがリリースされた場合に役立ちます。ただし、これは、独自のシーケンス プロトコルを設定して検証するユーザーにも役立ちます。
異なるソフトウェアとアライメントツールは、異なる結果を生み出すことができます33.本稿では、一般的に使用され、明確なドキュメントを持つ自由に入手可能なソフトウェアパッケージを使用することを目指しました。場合によっては、一般的によりユーザーフレンドリーなインターフェイスを持つ商用ツールを優先するが、支払いが必要な場合があります。将来的には、シーケンス技術やベース呼び出しソフトウェアの大きな変更が優先的に導入された場合に同じサンプルに適用できますが、現在の開発の速度を考えると、これは主要な更新後にのみ行うことができます。
シーケンスのエラー率の低下により、多重化するサンプル数が増えます。それにより、ナノポアシーケンシングは、インフルエンザウイルス診断の場合に既に当てはまる診断アッセイ用の従来のリアルタイムPCRの置き換えに近づいています。さらに、エラー率の低下は、例えばマイナーバリアントの決定やハイスループットの公平なメタゲノムシーケンシングなど、この技術シーケンシングのユーザビリティを向上させます。
プロトコルの重要なステップは、近く、信頼性の高い参照シーケンスを使用する必要があります。プライマーは、ウイルスの多様性に関する現在の知識に基づいており、たまに更新する必要があるかもしれません。アンプリコンベースのシーケンシングアプローチを設定する際のもう一つの重要なポイントは、アンプリコン深度の均一なバランスを得るためにプライマー濃度のバランスです。これにより、シーケンス実行でサンプルの多重化が可能になり、大幅なコスト削減が実現します。
著者らは開示するものは何もない。
この研究は、補助金契約第643476(COMPARE)に基づく欧州連合のHorizon 2020研究・イノベーションプログラムから資金を受け取っています。
Name | Company | Catalog Number | Comments |
Agencourt AMPure XP beads | Beckman Coulter | A63881 | |
dNTPs | Qiagen | 201900 | |
FLO-MIN106 R10 flowcell | Nanopore | R10 flowcell | |
KAPA Hyperplus libarary preparation kit | Roche | 7962436001 | |
Library Loading Bead Kit | Nanopore | EXP-LLB001 | |
Ligation Sequencing Kit 1D | Nanopore | SQK-LSK109 | |
Native Barcoding Kit 1D 1-12 | Nanopore | EXP-NBD103 | |
Native Barcoding Kit 1D 13-24 | Nanopore | EXP-NBD104 | |
NEB Blunt/TA Ligase Master Mix | NEB | M0367S | |
NEB Next Quick Ligation Module | NEB | E6056 | |
NEB Next Ultra II End Repair / dA-Tailing Module | NEB | E7546S | |
Protoscript II Reverse Transcriptase | NEB | M0368X | |
Q5 High-Fidelity polymerase | NEB | M0491 | |
Qubit dsDNA HS Assay kit | Thermo Fisher | Q32851 | |
Random Primers | Promega | C1181 | |
RNAsin Ribonuclease Inhibitor | Promega | N2111 |
このJoVE論文のテキスト又は図を再利用するための許可を申請します
許可を申請This article has been published
Video Coming Soon
Copyright © 2023 MyJoVE Corporation. All rights reserved