Method Article
プールされたDNAシーケンシングは、大規模コホートで複雑な表現型に関連付けられている稀な亜種を検出するための迅速かつ費用対効果の高い戦略である。ここでは、スプリンターソフトウェアパッケージを使用して、32のがん関連遺伝子のプールされた、次世代シーケンシングの計算分析を記述します。このメソッドは、スケーラブルで、目的の任意の表現型にも適用可能である。
DNAシーケンシング技術は著しく、近年2に進んでいるとして、それは任意の2つの個体間の遺伝的変異の量が以前に3を考えられていたよりも大きいことがますます明らかになった。対照的に、アレイ·ベースのタイピングは4,5共通の疾患の表現型の変動に共通の配列変異体の重要な貢献を識別するために失敗しました。まとめると、これらの観察は、一般的な、複雑な表現型の"失われた遺伝"の大半は、代わりに稀なまたはプライベートDNA変異体の個々の個人プロファイル6-8によるものであることを示唆している一般的な病気/まれな変異仮説の進化につながっている。しかし、まれな変異は、複雑な表現型をどのように影響するかを特徴付けることは、多くの遺伝子座で多くの影響を受ける個人の分析を必要とし、理想的に影響を受けないコホートで同様の調査と比較されます。今日のプラットフォームによって提供される電源シーケンシングにもかかわらず、多くの遺伝子座、必要に応じ、その後の計算機解析の人口ベースの調査では、多くの研究者のために法外なままである。
このニーズに応えるために、我々は、プールされたシーケンシングアプローチ1,9、得られたデータから高精度のまれな変異検出のための新しいソフトウェアパッケージ1を開発しました。影響を受ける個人や調査、単一のシーケンスのライブラリ内の複数の対象地域における遺伝的変異の程度の全体の集団からプールのゲノムへの能力は、従来の単一サンプルのシーケンシング手法に優れたコストと時間の節約を提供しています。 25倍の対立遺伝子あたりの平均シーケンスカバレッジで、我々のカスタムアルゴリズム、スプリンターは、最大のプールから1までの高感度と特異性で長さの4つの塩基対に挿入、欠失および置換を呼び出すために内部バリアントの呼び出し制御方式を使用しています500人の変異対立遺伝子。ここでは、プールされたのを調製するための方法を説明しますプールされたシーケンシングの解析(詳細はスプリンターパッケージを使用する方法についてステップバイステップの手順に続いて、ライブラリをequencing http://www.ibridgenetwork.org/wustl/splinter )。また、一人当たりのシーケンスの20キロバイト以上でゲノムワイドアレイを受けたすべての人の947人のプールされたシーケンスとの比較を示しています。タグ付きのタイピングとプールしたサンプルで呼び出され、新規の変異体との間の一致は良好であった。このメソッドは、容易にゲノム遺伝子座と個人の任意の数の任意の数にスケールアップすることができます。検討されて人口を模倣比で内部の正と負のアンプリコンのコントロールを組み込むことによって、アルゴリズムは、最適なパフォーマンスを得るために校正することができます。この戦略はまた、ハイブリダイゼーションのキャプチャまたは個々の固有のバーコードで使用するために変更することができ、例えば、腫瘍DNAなどの自然に異種のサンプルのシーケンスに適用することができます。
このメソッドは、Vallania FML らゲノム研究、2010年に報告された研究で使用されています。
1。サンプルプーリングと標的遺伝子座のPCRキャプチャ
2。プールされたPCRライブラリーの作製とシーケンシング
3。シーケンスは、アライメントと解析を読み込みます。
4。 SPLINTERを使用した希少なバリアント型(Variant)の検出
5。代表的な結果
我々は、947個体の集団をプールし、そして配列決定のために20キロバイト以上の対象とした。我々は、標準プロトコルを以下のまれな変異体の検出のための破片を適用した。各個人が以前にゲノムワイドなジェノタイピングアレイによって実行されるジェノ持っていた。タグ付きのタイピングとプールしたサンプルで呼び出され、新規変異体の間に一致します( 図6)優れていた。 3種類の2つ(rs3822343とrs3776110)は、人口では稀であったシークエンシングの結果からのde novoと呼ばれていました、個々のパイロシーケンシングによって検証されています。プール内のマイナーアレル頻度(MAF)は、MAFに類似していた dbSNPのビルド129に報告した。パイロシーケンシングおよびプールされたシーケンスの間にMAFの一致は、( 表3)優れていた。
陽性コントロールについては、 表1の DNAオリゴヌクレオチド配列。各シーケンスは2つの置換または1つの挿入と1の欠失のいずれかの方法で野生型の基準とは異なるDNA断片で構成されています。 拡大画像を表示するには、ここをクリック 。
表2。スプリンターの出力例を示します。最初の2行は、置換または欠失(青いヘッダ)の標準的なスプリンター出力を表しています。最後の行は、挿入のための標準的なスプリンター出力(紫ヘッダ)を表します。rget = "_blank">拡大画像を表示するには、ここをクリックしてください。
表3。ファイブは知られており、3つの新規変異体は、大規模な集団から識別し、個々の遺伝子型によって検証されています。個々の検証は、パイロシーケンシング(行1-3)は、TaqManアッセイ(行4-6)またはサンガー(行7,8)により行った。対立遺伝子頻度の広い範囲およびプールされたシーケンスアレル頻度の推定と個々の遺伝子型の間にMAF <1%、一致が強かった5つの位置を含む。アスタリスク(*)が付いている位置が以前に報告されたデータ9から構成されている。
図1。プール-DNAシーケンシングとスプリンター分析の概要。患者DNAがプールされと選択した遺伝子座で増幅されます。最終的なPCR産物は、モル比で、正と負の制御と一緒にプールされます。プールされたミックスは、次に塩基配列を決定し、得られた読み取りは、それらの参照にマッピングされています。マップされたネガティブコントロールは、実行固有のエラーモデルを生成するために使用され読み込まれます。スプリンターは、エラーモデルとポジティブコントロールから情報を組み込むことにより、稀SNPとindelsのを検出するために使用することができます。 [Vallania FLM ら、ゲノム研究 、2010年から適応] 拡大画像を表示するには、ここをクリック 。
図2プールのPCRアンプリコンライゲーションと超音波。ライゲーションとライブラリ調製プロトコルのランダム断片化手順のデモンストレーションとして、pUC19ベクターは、酵素的にレーン2に示すように、フラグメントに消化した。これらのフラグメントは、ノーマであった上記1.7のステップに従って、分子の数によってlized組み合わせて、ランダムに連結した。結果として大規模なコンカテマーは、レーン3に示されています。上記の手順1.8で説明したように連結したコンカテマーは、均等に分割し、超音波処理に供した。それぞれの技術的な複製のためのDNA断片の得られた塗抹標本は、レーン4および5に示されています。ブラケットは、ゲル抽出とシーケンシングライブラリの作成に使用されるサイズの範囲をハイライト表示されます。
図3。プールしたサンプル内の単一の対立遺伝子のカバレッジの関数としての精度。精度は0.5(ランダム)から1.0(完全な精度)の範囲で受信オペレーター曲線(ROC)の曲線下面積(AUC)と推定されています。 AUCは200、500および1000の対立遺伝子(A)のプール内の単一の変異対立遺伝子を検出するための対立遺伝子ごとに範囲の関数としてプロットされています。 AUCは、置換、挿入およびdの関数全体のカバレッジとしてプロットされeletions(B)。 [Vallania FLM ら、ゲノム研究 、2010年から適応。
図4エラープロットは、与えられた位置で、誤った塩基を組み込んだ確率を示しています。エラーのプロファイルは、読み取りシーケンスの3 '末端に向かって増加傾向で低エラーレートを示しています。特に、異なる基準ヌクレオチドが別のエラーの確率を(例えば、参照として与えられたG Cを組み込むことの確率を参照してください)が表示されます。 [Vallania FLM ら、ゲノム研究 、2010年から適応。
図5対立遺伝子あたり25倍以上の範囲を持っていたポジションの対立遺伝子頻度を推定する上でスプリンターの精度。パネルA、≥25倍のカバレッジを持つ単一の変異を検出するために最適な感度を示す図3の結果に基づいて非常に高い相関(r = 0.999)でGWAS結果によって測定されアレルカウントでSPLINTERによって推定した、プールされたDNAの対立遺伝子頻度の比較。 [Vallania FLM ら、ゲノム研究 、2010年から適応。
図6。974人のプールされたシーケンスからスプリンターの見積もりに比べGWASで測定した対立遺伝子頻度の比較。比較のための遺伝子型遺伝子と配列領域の間に19共通の立場があった。結果の相関(r = 0.99538)は非常に高くなっています。 拡大図を表示するには、ここをクリックしてください 。
肥満など8、高コレステロール血症4、高血圧7と他のような一般的な、複雑な表現型や疾患の発症と治療反応は珍しいバリエーションの個人プロファイルによってモデレートされることが増加の証拠がある。影響を受けた集団におけるこれらの変異体の集合体は深い診断および治療に影響を持っていますが、別々に影響を受ける個人を分析する時間とコストが法外なことができる遺伝子と経路を識別します。人口ベースの分析では、複数の遺伝子座に遺伝的変異を調査するためのより効率的な方法を提供しています。
私たちは、集団間の遺伝的変異のこのタイプを識別するために設計されたスプリンターソフトウェアパッケージとペアになって小説をプール-DNAシーケンシングプロトコルを提示します。我々であったまれな変異体を含む、947人の大規模なプールされた集団内でマイナーアレルを識別し、定量化に、このメソッドの精度を実証するプールされたシーケンスからのde novoと呼ばれ、個々のパイロシーケンシングによって検証されています。当社の戦略は、主に正の取り込み、すべての実験内の負の制御により、他のプロトコルとは異なります。これはスプリンターは、他のアプローチは1に比べてはるかに高い精度と消費電力を達成することができます。 25倍あたりの対立遺伝子の最適なカバレッジは、プールサイズに比例し、この要件として実現可能な大規模なプールの分析のみスケールを作り、独立してプールのサイズの固定されています。我々のアプローチは非常に柔軟性があり、関心の任意の表現型にもこのような混合細胞集団、腫瘍生検などの自然に不均一である試料に適用することができます。そのようなexomeやゲノムなどの大きなターゲット領域からプールされたシーケンスでますます関心があることを考慮すると、我々のライブラリの準備とSPLINTER分析では、カスタムキャプチャと全体exomeシーケンシングと互換性がありますが、スプリンターパッケージの配置ユーティリティはのために設計されていません大参照配列である。したがって、我々は、正常にプールしたサンプルからの呼び出しバリアント(ラモスら 、投稿中)、続いてゲノムワイドなアラインメントのために、Novoalign、動的プログラミングアライナーを利用しています。したがって、我々のプールされたシーケンシング戦略は、標的配列の増加量でより大きなプールに正常に拡張することができます。
利害の衝突が宣言されません。
この作品は子供ディスカバリー研究所助成MC-II-2006-1(RDMとTED)は、NIHロードマップのエピジェネティクスの助成金[1R01DA025744-01と3R01DA025744-02S1](RDMとFLMV)、U01AG023746(SC)、Saighによってサポートされていました財団(FLMVとTED)、1K08CA140720-01A1とアレックスのレモネード "は、"賞のサポート(TED)スタンド。我々は、ゲノム解析のヘルプは医学のワシントン大学で遺伝学部門のゲノムテクノロジー·アクセス·センターに感謝します。センターは、部分的に研究資源のためにNationalCenter(NCRR)、健康(NIH)の国立研究所のコンポーネントから#UL1RR024992 NCIがんセンターサポート助成サイトマンがんセンターへ#P30 CA91842によっておよびICTS / CTSAグラントによってサポートされており、医学研究のためのNIHロードマップ。このマニュアルでは、もっぱら著者の責任であり、必ずしもNCRRまたはNIHの公式見解を表すものではありません。
Name | Company | Catalog Number | Comments |
試薬名 | 会社 | カタログ番号 | セクション |
PfuUltraハイフィデリティ | アジレント | 600384 | 1.4 |
ベタイン | SIGMA | B2629 | 1.4 |
M13mp18 ssDNAのベクトル | NEB | N4040S | 1.5 |
をpGEM-Tイージー | プロメガ | A1360 | 1.5 |
T4ポリヌクレオチドキナーゼ | NEB | M0201S | 2.2 |
T4リガーゼ | NEB | M0202S | 2.2 |
ポリエチレングリコール8000 MW | SIGMA | P5413 | 2.2 |
断片化の超音波 | Diagenodeの | UCD-200-TS | 2.3 |
このJoVE論文のテキスト又は図を再利用するための許可を申請します
許可を申請This article has been published
Video Coming Soon
Copyright © 2023 MyJoVE Corporation. All rights reserved