Method Article
汇集DNA测序检测与大同伙的复杂表型相关的罕见的变异是一个快速和具有成本效益的战略。在这里,我们描述的汇集,32个癌症相关的基因,利用分裂软件包下一代测序的计算分析。这种方法可扩展性,适用于任何利益型。
随着DNA测序技术已经明显提前2近年来,它已成为越来越明显,任何两个人之间的遗传变异量是大于以前认为的3。相比之下,基于阵列的基因分型并没有确定一个共同的序列变异4,5的常见疾病的表型变异的重大贡献。两者合计,这些意见已导致常见疾病的演化/罕见的变异假说,表明多数是“缺失的遗传”中常见的和复杂的表型,而不是由于个人的个人资料罕见的或私人的DNA变异6-8 。然而,表征罕见的变异如何影响复杂表型需要许多受影响的个人,在许多基因位点的分析,是理想到不受影响的队列中的类似调查相比。尽管今天的平台,所提供的电源排序许多基因位点和随后的计算分析所需的人口为基础的调查仍让许多研究者望而却步。
为了满足这一需要,我们开发了汇集的测序方法1,9和一个新的软件包,从得到的数据高度准确的稀有变异检测1。从受影响的个人和整个人口调查的遗传变异程度在多个有针对性的地区,在一个单一的测序库池基因组的能力提供了极好的节约成本和时间,传统的单一样本的测序方法。平均每25倍的基因测序覆盖,我们的自定义算法,分裂,使用内部变量,调用控制策略调用4个碱基对的插入,删除和替换从高灵敏度和特异性的长度可达池1在500个人的突变等位基因。这里,我们描述为准备汇集小号的方法,其次equencing库如何使用汇集测序分析(碎片包一步一步的指示http://www.ibridgenetwork.org/wustl/splinter )。我们展示了汇集了947个人的测序之间的比较,所有的人也经历了全基因组阵列,超过20KB每人测序。标签的基因分型,并呼吁汇集样品中的新变种之间的一致性都非常优秀。这种方法可以很容易地扩展到任何数量的基因位点和任何个人。通过整合内部的正面和负面的扩增控制模拟研究人口的比率,该算法可以进行校准,以获得最佳性能。这一战略也被修改为与杂交捕获或个别特定条形码的使用,可应用于自然异质性样本,如肿瘤DNA测序。
采用这种方法在研究报告中Vallania FML今天等。基因组研究2010。
1。样品池,并有针对性的基因位点的PCR捕捉
2。 PCR技术图书馆汇集的制备和测序
3。测序读取校准和分析
4。罕见的变异检测,使用斯普林特
5。代表结果
我们汇集了947个人的人口,并有针对性的进行测序超过20 KB。我们采用分裂罕见的变异检测,按照我们的标准协议。每个人此前已通过全基因组阵列基因分型基因分型进行。标签的基因分型,并呼吁汇集样品中的新变种之间的一致性良好( 图6)。三个变种,其中两个(rs3822343和rs3776110)在人口罕见,被称为从头测序结果和个别焦磷酸测序验证。次要等位基因频率在池(MAF),类似的农林部报告在dbSNP的构建129。农林部之间的焦磷酸测序和汇集测序一致性非常好( 见表3)。
表1。DNA为阳性对照寡核苷酸序列。每个序列组成的DNA片段,从不同的野生型参考或者两个换人或插入和删除1。 点击这里查看大图 。
表2。分裂输出范例。前两行代表分裂替换或删除(蓝头)的标准输出。最后一行表示分裂插入(紫色头)的标准输出。rget =“_blank”>点击这里查看大图。
表3。五个已知和三个新变种,从庞大的人口数量确定,由单个基因分型验证。焦磷酸测序(1-3行),TaqMan方法Sanger测序(7,8行)(第4-6行)或个人进行验证。为等位基因频率范围广泛,包括五个位置农林部<1%,汇集测序等位基因频率估计和个人的基因分型之间的一致性是强劲的。带有星号(*)标记的位置是改编自先前公布的数据9。
图1。汇集DNA测序和碎片分析概述。病人的DNA汇集在选定的位点的扩增。最终的PCR产物集中在摩尔比阳性和阴性对照。汇集混合,然后测序,并由此产生的读取映射回参考。映射负控制的读取被用来生成运行特定的错误模型。碎片可以被用来检测的误差模型和阳性对照纳入信息罕见SNPs和INDELS。 [的FLM Vallania 2010年,基因组研究等改编] 点击这里查看大图 。
图2。汇集PCR扩增结扎术和超声。结扎和随机碎片的步骤,在图书馆准备协议的示范,pUC19载体酶消化巷2所示的片段。这些碎片是诺玛lized分子数,结合随机结扎根据上述步骤1.7。造成大concatamers巷3所示。结扎concatamers平分,受到超声上述步骤1.8中所述。每个技术复制的DNA片段产生涂片通道4和5所示。支架凸显了用于凝胶的提取和测序库创建的尺寸范围。
图3。作为一个汇集样品中的单等位基因功能的覆盖精度。精度估计下一个接收器操作曲线(ROC),范围从0.5(随机)1.0(完美的精确性)曲线(AUC)的地区。 AUC是绘制每个基因的功能,200,500和1000等位基因(一)池的单等位基因突变检测的覆盖。 AUC是绘制作为替换,插入和D功能全覆盖eletions(乙)。 [从Vallania的FLM 2010年,基因组研究等改编]。
图4。误差图显示了在一个给定的位置,纳入错误基地的概率。错误的文件显示低错误率增加的趋势,向3'结束测序读。值得注意的是,不同的参考核苷酸显示不同的错误概率(例如纳入作为参考一个C一个G的概率)。 [从Vallania的FLM 2010年,基因组研究等改编]。
图5。职位,有大于25倍的覆盖率每等位基因等位基因频率估计精度分裂。基于在A组, 图3显示最佳灵敏度≥25倍覆盖单变异检测,结果1池DNA的等位基因频率非常高的相关性(R = 0.999)的GWAS结果测得的等位基因数分裂估计的比较。 [从Vallania的FLM 2010年,基因组研究等改编]。
图6。等位基因频率相比,汇集了974个人的测序分裂估计的GWAS的测量之间的比较。有19常见的基因位点的位置和顺序地区之间进行比较。产生的相关性是非常高的相关(r = 0.99538)。 点击这里查看大图 。
有越来越多的证据表明,发病率和治疗反应常见的,复杂的表型和8肥胖,高胆固醇血症,高血压7和其他疾病,如可由个人档案罕见的变异主持。确定基因和途径,这些变种在受影响的人口聚集的地方将产生深远的诊断和治疗的影响,但单独分析受影响的个人,可以是时间和成本过高。人口为基础的分析提供了一个更有效的方法测量在多个位点的遗传变异。
我们提出一个新的池DNA测序协议旨在确定这个种群之间的遗传变异类型的与斯普林特软件的包配对。我们证明这种方法的准确性,在确定和量化次要等位基因在947个人的人口大汇集,包括罕见的变异从头从汇集测序和个人的焦磷酸测序验证。我们的策略主要是从其他协议不同,由一个积极的成立和在每一个实验的阴性对照。这允许分裂,以达到更高的精度和电源相比,其他方法1。每个等位基因的25倍,最佳的覆盖范围是固定的,独立池的大小,大池分析是可行的,这一要求与池大小的唯一尺度线性。我们的做法是非常灵活,可以应用于任何利益的表型,但也自然异构的样品,如混合细胞群和肿瘤活检。由于汇集从大的目标区域,如外显子组或基因组的测序日益增长的兴趣,我们的图书馆准备和碎片分析与自定义捕捉和全外显子组测序兼容,但没有被设计为在分裂包的对齐工具大引用序列。因此,我们已经成功地利用动态规划对准,Novoalign,从汇集的样本(拉莫斯等。提交)调用的变种的全基因组的路线。因此,我们汇集的测序战略可以成功扩展到较大的池,越来越多的靶序列。
没有利益冲突的声明。
这项工作得到了在儿童探知研究所授予的MC-二-2006年-1(RDM的和泰德),在NIH的表观遗传学蓝图补助金[1R01DA025744-01和3R01DA025744-02S1](RDM并且FLMV),U01AG023746(SC)的,在Saigh基金会(FLMV和TED),1K08CA140720-01A1和亚历克斯的柠檬水摊位“一奖”支持(TED)。我们感谢与基因组分析的帮助下,在华盛顿大学医学院遗传学系的基因组技术访问中心。该中心的部分支持NCI癌症中心支援津贴#P30的CA91842 Siteman癌症中心和ICTS /铁协批准UL1RR024992从NationalCenter研究资源(NCRR),美国国立卫生研究院(NIH)的一个组成部分,并国立卫生研究院医学研究路线图。本刊物完全是作者的责任,并不代表NCRR或NIH的官方意见。
Name | Company | Catalog Number | Comments |
试剂名称 | 公司 | 目录编号 | 部分 |
PfuUltra高,富达 | 安捷伦 | 600384 | 1.4 |
甜菜碱 | 西格玛 | B2629 | 1.4 |
m13mp18单链DNA载体 | NEB | N4040S | 1.5 |
至pGEM-T容易 | Promega公司 | A1360 | 1.5 |
T4聚核苷酸激酶 | NEB | M0201S | 2.2 |
T4连接酶 | NEB | M0202S | 2.2 |
聚乙二醇8000兆瓦 | 西格玛 | P5413 | 2.2 |
bioruptor sonicator | diagenode | UCD-200-TS | 2.3 |
请求许可使用此 JoVE 文章的文本或图形
请求许可This article has been published
Video Coming Soon
版权所属 © 2025 MyJoVE 公司版权所有,本公司不涉及任何医疗业务和医疗服务。