私たちは、ウイルスがどこから来て、どのように広がるかを理解するために、ウイルスの遺伝的シーケンシングを使用しています。また、たとえば、アウトブレーク時など、そのデータをリアルタイムで使用するには、データの正確さを正確に理解する必要があります。これらの技術の主な利点は、比較的安価で高速であり、現場でのシーケンスに使用できるリアルタイムのベースコーディングを可能にすることです。
この方法は、例えば、多数の病原体の起源を決定するために使用することができる配列データのタイムリーな生成に使用することができる。このテクニックは、初めてユーザーが必要とし、Unixの基本的な知識が必要な場合には複雑になる可能性があります。特に異なるソフトウェアパッケージのインストールのために。
このメソッドを視覚化すると、ユーザーは特定のシーケンス プロトコルのエラー率を判断するのに役立ちます。そして、研究の質問に答えるために。シーケンス実行は、MinIT に接続された MinION で開始されます。
Nanoporeプラットフォームでシーケンスを事前に形成した後、データ負荷をPorechopにロードします。汚染を防止し、精度を高めるために、下線の 2 つの下線バーコード フラグを使用して、指示に示すようにコマンドを入力します。多重化解除後、cutadaptを使用して、指示されたコマンドを使用して75ヌクレオチドより短い長さのプライマー配列および配列を除去する。
Minimap2 を使用して、個別の参照歪みのパネルに対してデマルチプレックス シーケンス読み取りをマップします。そして、コンセンサスシーケンスを生成するためにSamtoolsを使用しています。基準線形の場合、最も近い参照歪みを識別するために、生成されたコンセンサスシーケンスでブラストをプリフォームし、検索することが不可欠です。
次に、参照として最も近い参照ひずみで参照ベースの線形を繰り返します。Nanopore シーケンシングのエラープロファイルを補正するために必要な読み取りカバレッジを決定するには、1 つのアンプリコンにシーケンスマッピングを選択し、Minimap2 を使用して Nanopore 読み取りをこの Amplicon にマップします。Samtools を使用して、Amplicon26 への読み取りマッピングのみを選択し、示されているコマンドを使用して bam ファイルを fastq に変換します。
たとえば、200 シーケンスのサブセットをランダムに選択すると、1000 回読み取られます。ランダムに選択されたすべてのシーケンス読み取りは、Amplicon26 に揃えられます。KMA を使用してシーケンス読み取りをマップし、BC ナノフラグで示される Nanopore シーケンスの最適化された設定を使用して、すぐにコンセンサス シーケンスを生成します。
生成されたコンセンサスシーケンスを検査するには、指示に示されたコマンドを使用します。見出しの下の stats dot txt にエラー率を表示するには、マップされたエラー率の不一致の基数を示すコマンドを使用します。サイクルごとの見出しのインデルの下に表示されるインデルの数を表示するには、指定されたコマンドを使用します。
新しいフローセルをベースカラーフリップフロップと組み合わせて使用すると、40倍の読み込みカバレッジは、Illuminaシーケンスと比較して同じ結果になります。読み取りカバレッジが30倍の場合、0.02%の誤差率が得られますが、これは配列された585,000ヌクレオチドごとに1つの誤差に相当します。20回の読み取りカバレッジは、配列された63、529ヌクレオチドごとに1つのエラーをもたらす一方で。
10回の読み取りカバレッジは、配列された3、312ヌクレオチドごとに1つのエラーをもたらします。つまり、4つのウストゥウイルスゲノムあたり3ヌクレオチド以上が間違っていると呼ばれています。読み取りカバレッジが 30 回を超える場合、インデルは観察されません。
20 回の読み取りカバレッジは 1 つのインデル位置の検出をもたらし、10 回の読み取りカバレッジは 29 の位置でインデルになります。覚えておくべきことは、ソフトウェアの更新は必ずしも明らかではありませんが、頻繁に更新され、結果に影響を与える可能性があります。使用するソフトウェアには、いくつかのオプションがあります。
最も一般的に使用されるプログラムを実演しました。しかし、異なるソフトウェアとそれらのソフトウェアの異なるバージョンは、異なる結果をもたらす可能性があります。生成するシーケンスデータの品質を確認する方法の例を示しました。
そして、それは信頼性の高いアウトブレークサポートにとって重要です。