長い読み取りシーケンス大きく複雑なゲノム構造の変化の特徴付けとアセンブリを容易にします。ナノポア ベースのシーケンスのプラットフォームで超長いシーケンスを生成する方法について述べる。アプローチは、人間の細胞から中程度の範囲でプラスミド読み取りの数百人を生成する変更したライブラリの準備に続いて最適化された DNA の抽出を採用しています。
第三世代の 1 分子 DNA シーケンシング技術提供大幅に長く複雑なゲノムと複雑な構造の変形解析のアセンブリを容易にすることができます長さをお読みください。ナノポア プラットフォームは、直接 DNA の通過孔を介した現在の変更の測定によって単一分子シーケンス処理の実行し、最小限の資本コストでプラスミド (kb) の読み取りの数百を生成することができます。このプラットフォームは、さまざまなアプリケーションの多くの研究者によって採用されています。ナノ細孔シーケンシング プラットフォームの価値を活用する最も重要な因子は、長いシーケンスの読み取り距離を達成するため。超長い読み取りを生成するには、DNA の破損を避けるために、生産的な配列のテンプレートを生成する効率を得るために特別な配慮が必要です。ここでは、超長い DNA の塩基配列など新鮮なまたは冷凍細胞、機械的剪断またはトランスポザーゼ断片化によってライブラリーの構築から高分子量分画法 DNA 抽出とナノポア デバイスをシーケンス処理の詳細なプロトコルを提供します。HMW DNA の 20-25 μ g から 90 100 kb の読み取りトランスポザーゼと長さの N50 媒介断片化、およびメソッドは N50 機械的剪断で 50-70 kb の長さの読み出しを実現できます。プロトコルは哺乳類セルから抽出した DNA の構造変形とゲノムのアセンブリの検出の全ゲノム配列を実行するに適用できます。DNA の抽出および酵素反応の追加改善さらにリードの長さを増やすのユーティリティを展開します。
過去 10 年間超並列でかつ精度の高い第二世代高スループット シーケンス テクノロジーは生物医学的発見と技術革新1,2,3の爆発を駆動しています。技術の進歩にもかかわらず第 2 世代のプラットフォームで生成された短鎖リード データは複雑なゲノム領域の解決に効果がないと人間に重要な役割を担うゲノムの構造変形 (SVs) の検出に限られています。進化と病気の4,5。さらに、データの短い読み取りは繰り返し変動を解決することができないおよびハプロタイプが遺伝的変異6段階目の肥えたに適しています。
単一分子の配列を提供しています大幅に長くの最近の進歩を読む長さは、SVs7,8,9の完全なスペクトルおよび複合体の提供正確かつ完全なアセンブリの検出を容易にすることができます。微生物および哺乳類ゲノム6,10。ナノポア プラットフォームは、直接 DNA の通過孔11,12,13を介した現在の変更の測定によって単一分子シーケンスを実行します。ポリメラーゼの反応に依存することがなく、リアルタイムまたは人工に、ナノ細孔シーケンシングが長い (kilobases の何千もの数十) 読み取りを生成とは異なり、任意の既存の DNA シーケンスの化学、DNA サンプルの増幅。したがって、ナノ細孔長い読み低複雑さや繰り返しリッチで特に大きく前進するでしょうゲノム ・ バイオメディカル分析14、100 kb を越えて超長い読み取り距離を生成する (NLR seq) 保持している偉大な約束をシーケンス処理ゲノム15の地域。
ナノ細孔シーケンシングのユニークな特徴は、長いを生成するその可能性を理論上の長さ制限なし読み取りです。したがって、読み取りの長さは DNA の整合性とシーケンス テンプレートの品質によって直接影響を受ける DNA の物理的な長さによって異なります。また、操作やピペッティング力と抽出条件など、関連するステップの数の範囲によって DNA の品質は非常に可変。したがって、ちょうど標準の DNA の抽出のプロトコルや製造元の提供されるライブラリ工法を適用することによって長時間の読み取りを生成する 1 つの挑戦です。これに向けて、堅牢な開発した超長を生成する方法を読む (何百もの kilobases の) 収穫した細胞ペレットから始まるシーケンス データ。DNA の抽出とライブラリの準備の手順で複数の改善点を採用しました。我々 は DNA の劣化や損害賠償を引き起こす不必要な手順を除外するプロトコルを簡素化。このプロトコルは高分子量分画法で構成される DNA の抽出、超長い DNA ライブラリ構築およびナノポア プラットフォームの配列。よく訓練された分子生物学者の通常かかります 6 h セル HMW DNA 抽出、90 分またはライブラリ構築せん断方法によって、DNA シークエンシングのためさらに 48 h までの 8 h の完了するために収穫から。プロトコルの使用はゲノムの複雑性の私達の理解を改善し、人間の病気のゲノムの変化に新しい洞察力を得るためにゲノムのコミュニティに権限を与えます。
注: NLR seq プロトコル 3 連続ステップで構成されています: 1) 高分子の抽出重量分画法ゲノム DNA;任意の大きさに見られる DNA の断片化と dna シーケンス アダプターの ligation が含まれています 2) 超長い DNA ライブラリ構築終了します。・ 3) アダプター結紮 DNA ナノ細孔 (図 1) のアレイへの読み込み。
1. 高分子 DNA の抽出
2. 超長い DNA ライブラリ構築
注意: ナノポア シーケンス キットと相まって 2 つ異なるせん断方法に基づいて超長い DNA ライブラリを構築する 2 つの方法があります。機械的せん断ベースのライブラリは、ライブラリ構築の約 8 時間を取る 50-70 kb の N50 を使用してデータを生成します。トランスポザーゼ断片化ベースのライブラリは、ライブラリ構築にわずか 90 分を取って 90 100 kb のデータの N50 を生成します。機械的せん断プロトコルは、入力シーケンス アダプターとナノポア フローセルの品質の同一バージョンを使用して同じ DNA からより高い利回りを与えます。
3. ナノポア デバイスの配列
超長い DNA シーケンス プロトコルは、ライブラリ構築に高分子 DNA を適用します。したがって、それはライブの比率でよく培養細胞を選択する重要です > ステップを収穫セルで 85%。DNA の抽出に使用される細胞の量は、品質と見られる DNA の量に影響します。セル換散は、あまりにも多くの細胞で始まる場合にも動作しません。あまりにもいくつかの細胞を使用しても十分な DNA ライブラリ構築のため生成しません HMW DNA の沈殿物が高速遠心分離ではなく手で緩やかな回転を使用して実行されるため。冷えた 100% エタノールを追加し、回転は図 2に白い綿のような沈殿物として表示されます後 HMW DNA の例です。
ライブラリーの構築を開始する前に入力 DNA の品質をチェックすることが重要です。劣化、不適切な数量、汚染 (例えば、蛋白質、Rna、洗剤、界面活性剤と残留フェノールまたはエタノール)、低分子量 DNA は、以後の手順と長さを読んで最終的に大きく影響を持つことができます。高分子 DNA を含むチューブの 3 つの異なる場所から DNA を使った品質管理分析を実行をお勧めします。UV HMW DNA の結果を読んでから OD260/OD280値は約 1.9 と OD260/OD230値は約 2.3 (図 3 aB)。これらの比の値は良い HMW DNA サンプルの 3 つのテスト間で一貫しています。異なるせん断方法入力 DNA の別のボリュームが必要です。高分子 DNA 濃度は、する必要があります > それはする必要があります一方、機械的剪断の 200 ng/μ L > トランスポザーゼ断片化を 1 μ g/μ L。蛍光光度計で検出された濃度は紫外線を読むより少し低いです。ただし、同じ HMW DNA サンプルの濃度の変動係数は、蛍光光度計とアッセイを読んで UV 15% 未満をする必要です。高分子 DNA を破る針通過数はせん断の DNA のサイズに影響を与えるし、最終的な長さの読み出しに針と注射器を適用する機械的剪断します。針 HMW の DNA の大部分を確保するため剪断が図 4に示すように 50 kb を超えるサイズ QC を実行することをお勧めします。機械的せん断法では、30 のパスは、距離と出力の両方を考慮し、最高の結果を配列を生成しました。
機械的せん断ベース ライブラリの N50 は 50-70 kb トランスポザーゼ断片化ベース ライブラリは 90-100 kb です。HG00733 細胞株を用いた 4 つの実行の結果は、表 1のとおりです。すべての 4 失点がある 100 kb より長い長さで 2,300 以上の読み込み。最大長は長くトランスポザーゼ断片化ベース ライブラリで (455 kb、489 kb) (348 kb、387 kb) 機械的せん断ベース ライブラリと比較して後者を生産合計読み取りより高い利回りを示します。トランスポザーゼ断片化ベース ライブラリ構築、少数のステップおよび短い準備時間少ない短い断片を紹介します。トランスポザーゼを使用して 2 つの実行がより長い平均長さを持っている (> 30 kb) と中央の長さ (> 10 kb)。さらに、データは (平均品質スコアは基本精度約 10.0、~ 90%) のすべての実行で一貫した高品質を示しています。総基地の 97% 以上がデフォルトの設定で Minimap216を使用して人間の参照ゲノム (hg19) に配置されます。Raw 読み取りの予想サイズ分布は、図 5のとおりです。すべての実行トランスポザーゼ断片化ベースのライブラリが超長い読み取り (例えば > 100 kb) の高い比率を持っている 50 kb 以上のデータの大きい割合があります。このプロトコルは、複数のひと細胞株 (補足表 1) に正常に適用されています。
図 1: ナノポア長いリード シーケンス (seq NLR) ワークフローの図式的な概観します。オレンジ、複雑な転移。黄緑色、ナノポア アダプター。この図の拡大版を表示するのにはここをクリックしてください。
図 2: フェノール-クロロホルム抽出法から代表的な DNA の沈殿物です。白い矢印は、高分子 DNA を示します。この図の拡大版を表示するのにはここをクリックしてください。
図 3: UV 読書から見られる DNA の例 QC 結果。(A) HMW DNA ステップ 1.21.1 機械的剪断に基づく図書館の建設の準備ができてから。(B) HMW DNA 1.21.2 トランスポザーゼ断片化ベースのライブラリ構築のためのステップから。この図の拡大版を表示するのにはここをクリックしてください。
図 4: 針の品質管理結果が脈打フィールドゲルの電気泳動による高分子 DNA をせん断します。L1: クイック ロード 1 kb の DNA の梯子;L2: クイック ロード 1 kb 拡張 DNA の梯子。1-8: 針シャーリングにより異なる通過タイムが付いている DNA。1-3、せん断;4、10 回5、20 回6、30 回7、40 倍8、50 回。この QC 手順はオプションです。この図の拡大版を表示するのにはここをクリックしてください。
図 5: ナノポア超長い DNA ライブラリのサイズ分布を予想します。MS、機械的せん断ベース ライブラリ。TF、トランスポザーゼ断片化ベース ライブラリ。この図の拡大版を表示するのにはここをクリックしてください。
機械 shearing_rep1 | 機械 shearing_rep2 | トランスポザーゼ fragmentation_rep1 | トランスポザーゼ fragmentation_rep2 | |
セルライン | HG00733 | HG00733 | HG00733 | HG00733 |
読み取りの N50 | 55,180 | 63,007 | 98,237 | 95,629 |
100 Kb を超える読み取りの数 | 2,500 | 3,082 | 2,386 | 2,355 |
合計読み取りの数 | 97,859 | 80,465 | 24,166 | 21,032 |
最大長さ (bp) | 348,482 | 387,113 | 454,660 | 489,426 |
平均長さ (bp) | 17,861 | 20,395 | 33,528 | 38,175 |
中央の長さ (bp) | 5,335 | 5,894 | 10,249 | 15,656 |
読み取りの平均品質 | 10.0 | 10.1 | 9.9 | 10.0 |
Raw 読み取りの総基盤 | 1,747,849,822 | 1,641,058,932 | 810,229,733 | 802,886,304 |
一直線に並べられた読み取りの総基盤 | 1,693,300,832 | 1,607,975,925 | 791,422,077 | 778,417,627 |
マップされた比総基盤 (hg19、Minimap2) | 96.9% | 98.0% | 97.7% | 97.0% |
アクティブな毛穴の数 | 1225:480, 402, 254, 89 | 1058:480, 356, 176, 46 | 958:452, 328 148, 30 | 1092:487 367, 195, 43 |
表 1: パフォーマンス メトリックの概要は、せん断の異なるプロトコルで実行されます。
ライブラリ 1 | ライブラリ 2 | |
セルライン | K562 | GM19240 |
発注情報を携帯します。 | ATCC、猫。違います。CCL-243 | コーリエル医学研究所は、猫。違います。GM19240 |
プロトコル | 機械的剪断 | 機械的剪断 |
読み取りの N50 | 60,063 | 55,295 |
合計読み取りの数 | 193,783 | 120,807 |
中央の長さ (bp) | 1,843 | 4,688 |
平均長さ (bp) | 9,825 | 17,408 |
最大長さ (bp) | 548,780 | 212,338 |
Raw 読み取りの総基盤 | 1,903,989,686 | 2,103,015,331 |
一直線に並べられた読み取りの総基盤 | 1,837,350,047 | 1,997,419,761 |
マップされた比総基盤 (hg19、Minimap2) | 96.6% | 95.0% |
アクティブな毛穴の数 | 1111:482, 371, 203, 55 | 1032:447, 333, 196, 56 |
補足の表 1: 機械的せん断プロトコルと他のセルラインを使用して 2 つの NLR seq 実行の概要。
原則として、ナノ細孔配列は長さ11,12,13megabase の読み取りに 100 kb を生成すること。4 つの主要な要因はシーケンス処理の実行とデータの品質のパフォーマンスに影響します: 1) アクティブな孔数と; 毛穴の活動2) モーター蛋白質; ナノポアを通過する DNA の速度を制御します。3) DNA のテンプレート (長さ、純度、品質、質量);4) シーケンス アダプター結紮効率は、入力サンプルから使用可能な DNA を決定します。最初の 2 つの要因は、フローセルと、製造元によって提供されるシーケンス キットのバージョンによって異なります。次の 2 つの要因は、このプロトコル (HMW DNA の抽出、せん断および結紮術) で重要な手順です。
このプロトコルには、忍耐と練習が必要です。高分子 DNA の品質は、超長い DNA ライブラリ6にとって重要です。プロトコルは高い生存率と細胞から始まります (> 85% 実行可能なセル優先)、死んだ細胞から劣化 DNA を制限します。避けるべきである (例えば、強い不穏な揺れ、渦、複数ピペッティング、繰り返し凍結、融解) DNA に損傷を引き起こす可能性があります任意の過酷なプロセス。プロトコルの設計、我々 は DNA の抽出のプロセス全体でピペッティングを省略します。大口径のヒントは、ピペッティングが図書館の建設中に機械的剪断とシーケンスの後必要なときに使用する必要があります。孔は商工会議所バッファー12化学物質に敏感な必要がありますいくつかの残留汚染物質 (例えば、洗剤、界面活性剤、フェノール、エタノール、蛋白質 Rna 等) 可能な DNA の。長さと収量を考慮するフェノール抽出法は、これまでテスト複数の異なる抽出法と比較して最高と最も再現性のある結果を示しています。
長い読み取りシーケンスを生成するこのプロトコルの能力、にもかかわらず、いくつかの制限は残っています。まず、このプロトコルに最適化されたパブリケーションの時に利用できるナノ細孔シーケンシング デバイスに基づいてしたがって、ナノポア ベースのシーケンスの選択的な化学に制限され、長いリード シーケンス デバイスの他の種類で実行すると最適ではない可能性があります。第二に、結果は (組織または細胞) の原料から抽出した DNA の品質に大きく依存です。開始の DNA は既に劣化または破損した場合の長さの読み取りが低下します。第三に、QC の複数のステップは DNA の品質をチェックするプロトコルに組み込まれているが最終的な収量と読み取りの長さ、フローセルを受けます、間隙ナノ細孔シーケンシング プラットフォームのこの初期段階で変数となる活動開発。
説明されたプロトコルはここで DNA の抽出のため人間サスペンションのセル行のサンプルを使用します。針シャーリング、トランスポザーゼと結紮時間記述結果を見られる DNA の比率で通過時間を最適化します。プロトコルは、4 つの方法で拡張できます。まず、ユーザーは、他の哺乳類細胞と細胞、組織、臨床サンプル、または他の生物とは異なる金額を開始できます。遠心分離や反応量溶解インキュベーション時間をさらに最適化が必要となります。第二に、超長い読み込みシーケンスのターゲット サイズを予測するは難しいです。読み取りの長さが予想よりも短く、ユーザーは機械的剪断に基づく方法で通過時刻を調整したり、トランスポザーゼ トランスポザーゼの断片化法で見られる DNA の比率を変更できます。クリーンアップ手順を実行時にバインドと溶出時間は、高分子 DNA は粘性の高いので便利です。第三に、異なるナノ細孔シーケンシング デバイスと 1 つは、量と DNA シーケンサーの基準を満たすためのボリュームを調整できます。第四に、シーケンス アダプターに結紮 DNA のみをシーケンスに配置されます。結紮術の効率のさらに 1 つはアダプターとリガーゼ濃度を滴定しなさいを試行できます。変更された結紮時間とペグ18など分子混み合いエージェントは、将来的に適用できます。CRISPR19,20と組み合わせて超長い DNA シーケンス プロトコル可能性がありますターゲット濃縮シーケンスのための効果的なツールを提供しています。
著者は、彼らは競合する金銭的な利益があることを宣言します。
著者は Y. 朱の原稿で彼女のコメントをありがちましょう。この出版物で報告された研究は、賞を受賞番号 P30CA034196 の下で健康の国民の協会の国立癌研究所で部分的に支持されました。内容は著者の責任と国立衛生研究所の公式見解を必ずしも表さない。
Name | Company | Catalog Number | Comments |
Reagents | |||
Absolute ethanol | Sigma-Aldrich | E7023 | |
Agencourt AMPure XPbeads | Beckman | A63881 | magnetic beads for cleanup |
BD conventional needles | Becton Dickinson | 305136 | 27G, for mechanical shearing |
BD Luer-Lok syringe | Becton Dickinson | 309628 | for mechanical shearing |
Blunt/TA Ligase Master Mix | NEB | M0367S | |
Countess Cell Counting Chamber Slides | Invitrogen | C10228 | for cell counting |
EDTA | Invitrogen | AM9261 | pH 8.0, 0.5 M, 500 mL |
Flow Cell | Oxford Nanopore Technologies | FLO-MIN106 | R9.4.1 |
HG00773 cells | Coriell Institute | HG00733 | cells used in this protocol |
Ligation Sequencing Kit 1D | Oxford Nanopore Technologies | SQK-LSK108 | nanopore ligation kit |
MaXtract High Density tubes | Qiagen | 129073 | gel tubes |
NEBNext FFPE DNA Repair Mix | NEB | M6630S | |
NEBNext Ultra II End Repair/dA-Tailing Module | NEB | M7546S | |
Nuclease-free water | Invitrogen | AM9937 | |
Phosphate-Buffered Saline, PBS | Gibco | 70011044 | 10X, pH 7.4 |
Phenol:chloroform:IAA | Invitrogen | AM9730 | |
Proteinase K | Qiagen | 19131 | 20 mg/mL |
Qubit dsDNA BR Assay Kit | Invitrogen | Q32850 | fluorometer assays for DNA quantification |
Rapid Sequencing Kit | Oxford Nanopore Technologies | SQK-RAD004 | nanopore transposase kit |
RNase A | Qiagen | 19101 | 100 mg/mL |
SDS | Invitrogen | AM9822 | 10% (wt/vol) |
Sodium chloride solution | Invitrogen | AM9759 | 5.0 M |
TE buffer | Invitrogen | AM9849 | pH 8.0 |
Tris | Invitrogen | AM9856 | pH 8.0, 1 M |
Triton X-100 solution | Sigma-Aldrich | 93443 | ~10% |
Name | Company | Catalog Number | Comments |
Equipment | |||
Bio-Rad C1000 Thermal Cycler | Bio-Rad | 1851196EDU | |
Centrifuge 5810R | Eppendorf | 22628180 | |
Countess II FL Automated Cell Counter | Life Technologies | AMQAF1000 | for cell counting |
DynaMag-2 Magnet | Life Technologies | 12321D | magnetic rack |
Eppendorf ThermoMixer | Eppendorf | 5382000023 | for incubation |
Freezer | LabRepCo | LHP-5-UFMB | |
GridION | Oxford Nanopore Technologies | GridION X5 | nanopore device used in this protocol |
HulaMixer Sample Mixer | Thermo Fisher Scientific | 15920D | rotator mixer |
MicroCentrifuge | Benchmark Scientific | C1012 | |
NanoDrop ND-1000 Spectrophotometer | Thermo Fisher Scientific | ND-1000 | for UV reading |
Pippin Pulse | Sage Science | PPI0200 | pulsed-field gel electrophoresis instrument |
Qubit 3.0 Fluorometer | Invitrogen | Q33216 | fluorometer |
Refrigerator | LabRepCo | LABHP-5-URBSS | |
Vortex-Genie 2 | Scientific Industries | SI-A236 | |
Water bath | VWR | 89501-464 |
このJoVE論文のテキスト又は図を再利用するための許可を申請します
許可を申請さらに記事を探す
This article has been published
Video Coming Soon
Copyright © 2023 MyJoVE Corporation. All rights reserved