的16S核糖体RNA基因的扩增子的新一代测序

Sylvie Sanschagrin; Etienne Yergeau

doi:10.3791/51709

本文内容

摘要
摘要
引言
研究方案
结果
讨论
披露声明
致谢
材料
参考文献
转载和许可

摘要

Characterizing microbial community has been a longstanding goal in environmental microbiology. Next-generation sequencing methods now allow for the characterization of microbial communities at an unprecedented depth with minimal cost and labor. We detail here our approach to sequence bacterial 16S ribosomal RNA genes using a benchtop sequencer.

摘要

其中在微生物生态学中的主要问题是"谁在那里？"这个问题可以使用各种工具来回答，但对长期的黄金标准之一，是由序列域级别的PCR产生16S核糖体RNA（rRNA）的基因扩增反应，从基因组DNA扩增。传统上，这是通过克隆和桑格（毛细管电泳）的PCR扩增子的测序进行。新一代测序技术的出现，极大地简化并提高了测序深度16S rRNA基因测序。台式测序仪的引入，现在允许小型实验室进行内部的16S rRNA基因序列在几天之内。这里，使用台式下一代定序为16S rRNA基因的扩增子测序的方法详述。对环境的DNA首先通过PCR，使用含有序列适配器和条形码引物进行扩增。然后它们被耦合到通过乳液PCR方法的球形颗粒。颗粒是升oaded一次性芯片上和芯片插入后进行测序的测序机。的序列的检索fastq格式，过滤，条形码是用来建立样本成员的读取。该过滤和分级读取，然后使用公开可用的工具进一步分析。一个例子的分析，其中读出进行分类的软件包Mothur被赋予在一个分类寻找算法。这里介绍的方法简单，价格低廉，简单，应该帮助小型实验室，以利用从正在进行的基因组革命。

引言

宏基因组测序是一个非常强大的技术，因为它的目标包含了环境样品中的遗传信息的全部内容。有不同口味的宏基因组测序，包括鸟枪法测序，大插入库和扩增子测序。扩增子的测序提供了相对便宜，快速，能够产生读取从可大致排列的单个基因组区域的优点。此外，数据分析的工作流程的扩增子测序大多标准化。然而，因为它是基于PCR技术，它具有所有相关的不完全特异性的，不完整的覆盖和引物的偏见施力^1,2，这使得该方法的半定量的最好的。几个基因组区域可以有针对性的扩增子测序，包括功能基因，但最流行的选择是使用标记基因如16S rRNA基因生成的社区形象。传统上，16S rRNA基因的扩增子sequencing进行了使用劳动力密集的技术，其中包括克隆在大肠杆菌大肠杆菌 ，菌落采摘和质粒提取，随后用Sanger测序对分离的质粒，并因此，大多数研究分析每个样品少于100个克隆。下一代测序带来两个主要的进步:大规模并行化的测序反应，而最重要的是，对模板的克隆分离，而无需插入的基因片段在宿主中。这极大地简化了16S rRNA基因扩增子测序，这是现在回来许多环境微生物学研究的常规功能，造成了"复兴"的16S rRNA基因扩增子测序^3。

由于罗氏454测序于2005年⁴问世，其他几个新一代测序技术已经出现在市场上（如 Illumina公司，实心，PacBio）。最近，推出台式序列RS带到小型实验室的测序能力以前仅限于大测序中心。五台式机是目前可供选择:454 GS少年，离子激流个人基因组机（PGM）和质子，以及Illumina的MiSeq和NextSeq 500虽然所有这些音序器提供每少跑和每美元减少基地读取比大多数全大规模测序仪，它们更灵活，快速，而且其低购置和运行成本，使他们负担得起的小型学术实验室。台式测序仪特别适合于扩增子，小基因组和低复杂度的宏基因组测序在环境微生物学研究好，因为这种类型的研究，一般不需要测序的一个极端的深度。例如，人们普遍认为，对于16S rRNA基因测序研究的读取次数，每个样品是不是最重要的，因为〜1,000读取可以生成相同的图案作为多亿读取数据集^5。话虽如此，台面下generatio Ñ音序器仍然会产生大量的序列数据，以最大产量〜35 MBP（454 GS初级）〜2 GBP（离子洪流PGM），〜10-15 GBP（离子激流腾）〜10 GBP（Illumina的MiSeq）和〜100 GBP（Illumina公司下一步SEQ 500），这是以上对于大多数环境微生物学研究不够。

使用台式测序仪16S rRNA基因扩增新一代测序最近已经应用于各种环境中。例如，所述离子洪流PGM已用于社会铀尾矿该过再循环油砂开采影响沉积物的水产养殖系统的烃污染北极土壤^{8,9 7，}特别高的pH值和低渗透性^6，分析和从阿萨巴斯卡河^10,11生物膜柳树种植的人类和动物的尸体^13-16的污染土壤¹²和厌氧沼气池¹⁷的根际。

jove_content">在这方面的贡献，我们详细我们的方法使用台式下一代定序（离子激流PGM）进行排序内部16S rRNA基因扩增的DNA提取后，16S rRNA基因使用包含域级细菌引物扩增测序接头和独特，样本特异性序列（条码）的扩增子进行纯化，定量并汇集在等摩尔比的混合样品然后被克隆扩增以乳液PCR和测序。结果序列是使用公开可用的生物信息学工具（分析例如，Mothur）。

研究方案

1，16S rRNA基因扩增子文库制备的融合方法

解冻的引物（正向，F343-IONA-MIDXX:5'-CCA TCT CAT CCC TGC GTG TCT CCG交流 牛逼的CAG XXX XXX XXX XTA CGG鲁尔GCA GCA的G-3';反转，R533-IonP1:5'-CCT四氯化碳达GGG CAG TCG GTG AT A TTA CCG CGG CTG CTG的GC-3';大胆:离子激流专用适配器;斜体字:排序键校准信号强度的测序运行的开始;字体:模板的特异性引物，X ... ×:10碱基对的条形码， 如表1一些条形码序列），2倍HotStartTaq加上主混合物和样品。使用前调匀，除了主结构应该轻轻混合。
准备PCR混合物（20微升反应）与0.5微米的反向引物，0.4毫克/毫升牛血清白蛋白（BSA）和1个HotStartTaq加上主结构。加入预混的18.5微升至eACH PCR管。
添加一个正向引物（0.5微升20毫米），不同的条形码为每个将要一起测序样品。加入1μl样品（1-10纳克/微升）的PCR管。
发生在PCR仪的管子，然后运行以下程序:5分钟预变性95℃; 95℃，25个循环，30秒，55℃30秒，72℃45秒;在72℃下进行10分钟的最终延伸。 PCR产物可以保持在4℃的CO / N或冷冻直至使用。

2，扩增子的分离纯化，定量和池

使用最大可用梳子准备了2％琼脂糖凝胶。加入5微升的6倍的凝胶上样染料对凝胶反应和负载，每个样品通过一个空的分离良好。运行在70 V凝胶50分钟。
以凝胶的图片和削减波段（预计规模约250基点:190 bp的产品加63个基点适配器和条形码）用干净的手术刀。
称量切除乐队，并继续与凝胶的提取和纯化的PCR产物（如与QIAquick凝胶提取试剂盒）。
量化每个PCR产物用的PicoGreen和使稀释液，得到储备液以5×10 ⁹个分子/微升（约1毫微克/微升）。如果一些样品显示出较低的放大，调整稀释至较低浓度，牢记适于后续程序的最低浓度是1.57×10 ⁷个分子/μl的（26点）。
池10微升的每个稀释的PCR产物以获得样本的等摩尔池。准备为每个计划的测序运行的一个独立的游泳池。汇集的PCR产物可以保存在冰箱中直到使用。

3，乳液PCR和测序

执行乳液PCR方法:
1. 淡化汇集PCR产物26日下午在25微升的体积。解冻剂从离子PGM模板套件。
2. 准备乳液PCR混合物（试剂盒提供的试剂）在PCR罩和板凳上添加汇集PCR产物与球体颗粒（提供）。调匀，并在过滤器滤芯插入混合物中，用乳化油仔细TOP（提供）。
3. 缓慢反向滤筒和负载上的自动乳剂PCR设备（ 例如，离子单键2仪器）。选择合适的方案，并启动程序。
自动化的乳液PCR完成后，除去从集合管的上清液，并在管的底部取回球体颗粒。悬浮在100μl的洗涤液（试剂盒提供）的领域和需要2.0微升等分图书馆量化。
执行库量化。
1. 混合100μl的SSPE缓冲液（150 mM氯化钠，10mM的磷酸钠_4，1mM的娜₂ -EDTA）与2微升适配器B'秘境（5'-FAM -CTğAGA CTG CCA AGG CAC ACA GGG GAT AGG-3'）探头和2微升适配器A-Cy5信号（5'-Cy5的 -CCA TCT CAT CCC TGC GTG TCT CCG ACT CAG-3'）的探针。加入52微升该混合物到在步骤3.2所采取的2.0微升等分试样，并添加2微升的洗涤溶液中（从模板试剂盒）对剩余的52微升作为空白进行定量。
2. 孵育在95℃下2分钟，然后在37℃下持续2分钟。转让1.5 ml离心管的混合物。
3. 添加1.0 TEX缓冲液（10毫米的Tris，1 mM的EDTA，0.01％的Triton X-100，pH值8.0）毫升，混匀并离心15,500 xg离心3分钟在室温。除去上清液，留下20微升在每个管中。重复此洗涤步骤两次。
4. 加入180微升TEX缓冲区，悬浮沉淀的颗粒转移到500微升量子比特管。
5. 使用量子比特装置，测量荧光的FAM和Cy5和计算使用可用的离子社群网站上的计算器正球体的比例。
丰富的球体颗粒使用自动化富集系统（ 例如，离子一键捕获系统）正球（含扩增DNA）的剩余部分。
1. 移液管的试剂在所提供的8孔条中的适当的孔中:好1:从步骤3.2球形颗粒;以及2:预洗MyOne链霉亲和C1珠（13微升）;以及3，4和5:洗涤溶液（在模板试剂盒中提供）;以及6:空;以及7:熔断溶液（125mM的氢氧化钠，0.1％吐温20）;以及8:空。
2. 安装在移液臂尖和0.2 ml管的样品采集。启动仪器。在浓缩的结尾，加10微升中和液（提供）。富集的颗粒可以保存4℃下15天。
初始化测序仪:
1. 连接到测序仪，并准备测序运行计划，指定测序运行的详细信息。
2. INSTAL升的洗涤溶液＃2（在Ion PGM测序试剂盒提供）中，洗涤溶液＃1（350微升的100mM NaOH）和自动pH缓冲溶液（设置）。
3. 启动初始化程序，并在出现提示时在各自的50ml试管中添加的dATP，三磷酸dCTP和dTTP的核苷酸（提供）。拧管到测序仪，并继续初始化程序。当初始化完成后，立即开始运行程序。
制备的样品进行测序，并加载芯片:
1. 通过在15,500 XG离心1.5分钟收集来自步骤3.4在管底部的富氧球体。除去上清液离开正好3微升。
2. 加入3μL测序引物（在测序试剂盒提供），吹打起来调匀上下悬浮颗粒。孵育在95℃下2分钟，然后在37℃下持续2分钟。
3. 加入1μl聚合酶（提供），拌匀incub的吃在RT 5分钟。继续加载在30分钟内对测序芯片酶球体混合物。
4. 在培养过程中，加载的编曲测序芯片进行芯片的质量检查。通过离心除去从芯片的液体和通过缓慢移液向下酶球体混合物（7微升），并避免在芯片中引入的气泡的加载在芯片中的样本。
5. 离心芯片三次，在微量离心1分钟。改变芯片在每个离心的方向和通过上下吹打在每次运行之间混合。
6. 装载仪器的芯片，并开始运行。

4，基本序列数据分析

连接到定序的数据服务器并下载fastq文件。创建一个制表符分隔的"寡"含底漆和条形码信息（参见示例见表1）文件。从MOT下载Greengenes参考文件许网站（ http://www.mothur.org/wiki/Taxonomy_outline ）。
启动Mothur并进行分析:
1. 使用下面的命令转换为fastq文件到FASTA和质量文件:fastq.info（fastq = test.fastq）
2. 确定每个序列的组成员，并使用以下命令修剪的顺序:trim.seqs（FASTA = test.fasta，寡= barcode.txt，QFile时= test.qual，qwindowaverage = 20，qwindowsize = 50，= MINLENGTH 150， keepforward = T）
3. 各种选项可根据所需的严格性来修改
4. 使用下面的命令进行分类的greengenes分类序列:classify.seqs（FASTA = test.trim.fasta，方法=旺，组= test.groups，模板= gg_99_otus.fasta，分类= gg_99_otus.tax，截止= 50）

结果

纯化的凝胶后，用PCR扩增25个循环，扩增产物通常是在0.2-10.0的浓度纳克于50μl水中。这可能会发生变化很大，这取决于起始的DNA浓度，样品的类型和所用的纯化试剂盒上。它建议保持PCR循环数，以最低可能的，以避免嵌合体的形成，并降低扩增偏倚，牢记，所有样品应使用周期相同数量的扩增。以最小化多克隆读取数和空球和最大化的读取次数，量子比特率应介于0.1和0.3和FAM荧光应高于200使用314芯片上的离子洪流PGM，平均输出大约是结果在Mothur的滤波后0.3-0.5拿手质量的读取。表2示出了一些典型的故障的过程的每个步骤中为含36多路复用ENVIRON运行后读取心理样品扩增引物靶向16S的V3-4地区和分析使用Mothur。在Mothur的trim.seqs程序生成一个包含通过质量过滤器和一个"* .scrap.fasta"包含该序列没有随着原因通过质量过滤器的序列的"* .trim.fasta"文件为抑制在序列标题。当条形码中的"寡"的文件提供，该命令也将产生一个"* .groups"文件，该文件包含基于条形码序列中的每个序列的组成员。该classify.seqs过程生成一个".tax.summary"，可以在Excel中打开。此文件包含的分类单位（以行为单位）对每个样品的摘要（中柱）。此文件可用于下游的统计分析和可视化的群落组成在不同分类级别。在".taxonomy"文件中包含了详细的分类归属于每个序列。在所有36个样品的语系/一流水平的平均社会组成如图1所示。

figure-results-774
图1:平均群落组成，在所有样品中的动物门/一流水平。

前进	TACGGRAGGCAGCAG
条形码	CTAAGGTAAC	Sample01
条形码	TAAGGAGAAC	Sample02
条形码	AAGAGGATTC	Sample03
条形码	TACCAAGATC	Sample04
条形码	CAGAAGGAAC	Sample05
条形码	CTGCAAGTTC	Sample06
条形码	TTCGTGATTC	Sample07
条形码	TTCCGATAAC	Sample08
条形码	TGAGCGGAAC	Sample09
条形码	CTGACCGAAC	Sample10

表1。实施"寡"的文件中Mothur使用 。

	＃的读取	％上一步	平均。每个样品
井数	1262519	-	35070
井珠	1114108	88.20％	30947
珠模板	1112746	99.90％	30910
单克隆珠	826805	74.30％	22967
质量好读（输出的音序）	782204	94.60％	21728
通Mothur过滤器（分平均20质量分数超过50个基点的窗口，最小150个基点的长度）	372168	47.60％	10,338
在GreenGenes的动物门级分类（50％置信度阈值）	342171	91。90％	9505
在GreenGenes家庭一级分类（50％置信度阈值）	316512	92.50％	8792
在GreenGenes属级分类（50％置信度阈值）	289899	91.60％	8053

读取从一个典型的奔跑为36环境样品复用在一个离子洪流314芯片产生的表2编号。

讨论

这里介绍的方法是简单的和便宜的，并允许许多实验室访问宏基因组测序的能力。虽然它取决于所采用的测序平台，一旦文库构建很少的手工操作时间是必需的，与大多数的过程中被自动化。对于这里所用的测序平台（离子洪流PGM），该完整的程序可以在工作两天进行。在编写（2013年9月）的那一刻，与上文所详述的例子中，试剂成本如下:PCR检测36个样品的扩增:25元，凝胶净化和的PicoGreen的DNA的36个样品定量:125美元，乳液PCR方法一池扩增子样品:$ 150测序试剂:250元，共计550元或15元的样品或0.0015美元每质量过滤读取。此价格不包含仪器的服务合同，仪器折旧，技术人员的工资和实验室空间使用情况。

帐篷">其中最重要的步骤是泳池的所有产品的等摩尔比，以便检索相似数目的读取为各样品。的PicoGreen定量在这里使用的，但其他的方法可能是合适的，但较不准确（ 例如，紫外定量，基于凝胶的量化），即使这样做是最精确的定量和池，有在每个样品中读取数一些可变性，并在典型的运行在表2中详述的，其范围是从4380到32750读出，以平均10338读取，如果处理大量样品（大于40-50）的，单柱凝胶纯化可以通过凝胶纯化来代替在使用平板或纯化珠用严格的尺寸切断（ 例如，AMPure珠）。

到目前为止，最常用的下一代测序技术的16S rRNA基因是454在这个协议中所使用的离子激流测序技术是概念上非常类似到454和这两种技术都容易产生相同类型的排序错误。不足为奇的是，它表明，离子激流测序导致测序结果非常相似，454测序^10。近年来，许多研究人员研究利用Illumina的技术的16S rRNA基因扩增子测序^18,19。在任何情况下，这将是很容易通过改变融合引物的序列以匹配所需要的这些测序技术的适配器和条形码一样，在该方法中最近描述的，以适应当前的协议，用于其他的台式测序仪一样的Illumina MiSeq或454 GS小型对于Illumina的MiSeq ^19。另外，研究人员可以按照步骤1和2在这里详细的协议，并发送汇集扩增到乳液PCR和测序将进行测序中心。

16S rRNA基因的读取进行修整和归类使用Mothur，但许多其它的分析，可以执行上16S rRNA基因的扩增子。例如，β多样性可以通过计算在使用中列出的步骤每个样本对之间的Unifrac距离进行评估http://unifrac.colorado.edu/ ^20。阿尔法多样性指数和各样品的业务分类学单元的数目可以使用工具内QIIME像AmpliconNoise ²¹或使用由Huse 等²²和可用的内Mothur概述的过程来计算。

这里所用的引物扩增的可变区3和4的16S rRNA基因，但是许多其他区域可以被定位的。在本研究中，16S rRNA基因是从植物材料中扩增和引物的选择是为了避免叶绿体16S rRNA基因^23,24的扩增。有各种各样的变化是在产品长度，分类能力和有效性^25,26的术语可用的其它引物。然而，在所有的情况下200-400 bp的读出的16S rRNA基因不能可靠归类在种的水平，并分析仅限于属和更高的分类学水平。如果需要物种水平上的信息，如cpn60和的rpoB基因^27,28其它基因可能是更合适的。未来大幅下降的测序，并增加对分析工具的权力的成本可能会使得人们能够通过元基因组鸟枪取代16S rRNA基因序列，但在那之前的16S rRNA基因测序仍然环境微生物的黄金标准。

披露声明

The authors have nothing to disclose.

致谢

Development of the method presented here has been carried out with various sources of funding, including Genome Canada and Genome Quebec, Environment Canada STAGE program and internal NRC funds.

材料

Name	Company	Catalog Number	Comments
Ion 314 Chip Kit v2	Life Technologies	4482261
Ion PGM Sequencing 200 Kit v2	Life Technologies	4482006
Ion PGM Template OT2 200 Kit	Life Technologies	4480974
HotStarTaq Plus Master Mix Kit	Qiagen	203646
Primers and probes	IDT	NA
Qiaquick Gel Extraction Kit	Qiagen	28704
BSA 20 mg/ml	Roche	10,711,454,001
Dynabeads MyOne Streptavidin C1	Life Technologies	65001

参考文献

Sipos, R., et al. Addressing PCR biases in environmental microbiology studies. Methods Mol. Biol. 599, 37-58 (2010).
Schloss, P. D., et al. Reducing the effects of PCR amplification and sequencing artifacts on 16S rRNA-based studies. PLoS ONE. 6, e27310 (2011).
Tringe, S. G., Hugenholtz, P. A renaissance for the pioneering 16S rRNA gene. Curr. Opin. Microbiol. 11, 442-446 (2008).
Margulies, M., et al. Genome sequencing in microfabricated high-density picolitre reactors. Nature. 437, 376-380 (2005).
Kuczynski, J., et al. Microbial community resemblance methods differ in their ability to detect biologically relevant patterns. Nat. Methods. 7, 813-819 (2010).
Bondici, V. F., et al. Microbial communities in low-permeability, high pH uranium mine tailings: characterization and potential effects. J. Appl. Microbiol. 113, 1671-1686 (2013).
Auffret, M., et al. Impact of water quality on the bacterial populations and off-flavours in recirculating aquaculture systems. FEMS Microbiology Ecology. 84, 235-247 (2013).
Bell, T. H., Yergeau, E., Juck, D., Whyte, L. G., Greer, C. W. Alteration of microbial community structure affects diesel biodegradation in an Arctic soil. FEMS Microbiol. Ecol. 85, 51-61 (2013).
Bell, T. H., et al. Predictable bacterial composition and hydrocarbon degradation in Arctic soils following diesel and nutrient disturbance. ISME J. 7, 1200-1210 (2013).
Yergeau, E., et al. Next-generation sequencing of microbial communities in the Athabasca River and its tributaries in relation to oil sands mining activities. Appl. Environ. Microbiol. 78, 7626-7637 (2012).
Yergeau, E., et al. Aerobic biofilms grown from Athabasca watershed sediments are inhibited by increasing bituminous compounds concentrations. Appl. Environ. Microbiol. 79, 7398-7412 (2013).
Yergeau, E., et al. Microbial expression profiles in the rhizosphere of willows depend on soil contamination. ISME J. 8, 344-358 (2013).
Deagle, B. E., et al. Quantifying sequence proportions in a DNA-based diet study using Ion Torrent amplicon sequencing: which counts count. Mol. Ecol. Resour. 13, 620-633 (2013).
Milani, C., et al. Assessing the fecal microbiota: an optimized Ion Torrent 16S rRNA gene-based analysis protocol. PLoS ONE. 8, e68739 (2013).
Jünemann, S., Prior, P., Szczepanowski, R., Harks, I., Ehmke, B., Goesmann, A., Stoye, J., Dag Harmsen, . Bacterial community shift in treated periodontitis patients revealed by Ion Torrent 16S rRNA gene amplicon sequencing. PLoS ONE. 7, e41606 (2012).
Petrof, E., et al. Stool substitute transplant therapy for the eradication of Clostridium difficile infection: 'RePOOPulating' the gut. Microbiome. 1, 3 (2013).
Whiteley, A. S., et al. Microbial 16S rRNA Ion Tag and community metagenome sequencing using the Ion Torrent (PGM) Platform. J. Microbiol. Meth. 91, 80-88 (2012).
Caporaso, J. G., et al. Ultra-high-throughput microbial community analysis on the Illumina HiSeq and MiSeq platforms. ISME J. 6, 1621-1624 (2012).
Kozich, J. J., et al. Development of a dual-index sequencing strategy and curation pipeline for analyzing amplicon sequence data on the MiSeq Illumina sequencing platform. Appl. Environ. Microbiol. 79, 5112-5120 (2013).
Hamady, M., et al. Fast UniFrac: facilitating high-throughput phylogenetic analyses of microbial communities including analysis of pyrosequencing and PhyloChip data. ISME J. 4, 17-27 (2010).
Quince, C., et al. Removing noise from pyrosequenced amplicons. BMC Bioinformatics. 12, 38 (2011).
Huse, S. M., et al. Ironing out the wrinkles in the rare biosphere through improved OTU clustering. Environ. Microbiol. 12, 1889-1898 (2010).
Edwards, J. E., et al. Characterization of the dynamics of initial bacterial colonization of nonconserved forage in the bovine rumen. FEMS Microbiol. Ecol. 62, 323-335 (2007).
Rastogi, G., et al. A PCR-based toolbox for the culture-independent quantification of total bacterial abundances in plant environments. J. Microbiol. Methods. 83, 127-132 (2010).
Baker, G. C., et al. Review and re-analysis of domain-specific 16S primers. J. Microbiol. Methods. 55, 541-555 (2003).
Schloss, P. D. The effects of alignment quality, distance calculation method, sequence filtering, and region on the analysis of 16S rRNA gene-based studies. PLoS Comput. Biol. 6, e1000844 (2010).
Links, M. G., et al. The chaperonin-60 universal target Is a barcode for bacteria that enables de novo assembly of metagenomic sequence data. PLoS ONE. 7, e49755 (2012).
Vos, M., et al. Comparison of rpoB and 16S rRNA as markers in pyrosequencing studies of bacterial diversity. PLoS ONE. 7, e30600 (2012).

转载和许可

请求许可使用此 JoVE 文章的文本或图形

请求许可

探索更多文章

90 16S RNA

This article has been published

Video Coming Soon

Keep me updated: