Method Article
Characterizing microbial community has been a longstanding goal in environmental microbiology. Next-generation sequencing methods now allow for the characterization of microbial communities at an unprecedented depth with minimal cost and labor. We detail here our approach to sequence bacterial 16S ribosomal RNA genes using a benchtop sequencer.
其中在微生物生态学中的主要问题是"谁在那里?"这个问题可以使用各种工具来回答,但对长期的黄金标准之一,是由序列域级别的PCR产生16S核糖体RNA(rRNA)的基因扩增反应,从基因组DNA扩增。传统上,这是通过克隆和桑格(毛细管电泳)的PCR扩增子的测序进行。新一代测序技术的出现,极大地简化并提高了测序深度16S rRNA基因测序。台式测序仪的引入,现在允许小型实验室进行内部的16S rRNA基因序列在几天之内。这里,使用台式下一代定序为16S rRNA基因的扩增子测序的方法详述。对环境的DNA首先通过PCR,使用含有序列适配器和条形码引物进行扩增。然后它们被耦合到通过乳液PCR方法的球形颗粒。颗粒是升oaded一次性芯片上和芯片插入后进行测序的测序机。的序列的检索fastq格式,过滤,条形码是用来建立样本成员的读取。该过滤和分级读取,然后使用公开可用的工具进一步分析。一个例子的分析,其中读出进行分类的软件包Mothur被赋予在一个分类寻找算法。这里介绍的方法简单,价格低廉,简单,应该帮助小型实验室,以利用从正在进行的基因组革命。
宏基因组测序是一个非常强大的技术,因为它的目标包含了环境样品中的遗传信息的全部内容。有不同口味的宏基因组测序,包括鸟枪法测序,大插入库和扩增子测序。扩增子的测序提供了相对便宜,快速,能够产生读取从可大致排列的单个基因组区域的优点。此外,数据分析的工作流程的扩增子测序大多标准化。然而,因为它是基于PCR技术,它具有所有相关的不完全特异性的,不完整的覆盖和引物的偏见施力1,2,这使得该方法的半定量的最好的。几个基因组区域可以有针对性的扩增子测序,包括功能基因,但最流行的选择是使用标记基因如16S rRNA基因生成的社区形象。传统上,16S rRNA基因的扩增子sequencing进行了使用劳动力密集的技术,其中包括克隆在大肠杆菌大肠杆菌 ,菌落采摘和质粒提取,随后用Sanger测序对分离的质粒,并因此,大多数研究分析每个样品少于100个克隆。下一代测序带来两个主要的进步:大规模并行化的测序反应,而最重要的是,对模板的克隆分离,而无需插入的基因片段在宿主中。这极大地简化了16S rRNA基因扩增子测序,这是现在回来许多环境微生物学研究的常规功能,造成了"复兴"的16S rRNA基因扩增子测序3。
由于罗氏454测序于2005年4问世,其他几个新一代测序技术已经出现在市场上( 如 Illumina公司,实心,PacBio)。最近,推出台式序列RS带到小型实验室的测序能力以前仅限于大测序中心。五台式机是目前可供选择:454 GS少年,离子激流个人基因组机(PGM)和质子,以及Illumina的MiSeq和NextSeq 500虽然所有这些音序器提供每少跑和每美元减少基地读取比大多数全大规模测序仪,它们更灵活,快速,而且其低购置和运行成本,使他们负担得起的小型学术实验室。台式测序仪特别适合于扩增子,小基因组和低复杂度的宏基因组测序在环境微生物学研究好,因为这种类型的研究,一般不需要测序的一个极端的深度。例如,人们普遍认为,对于16S rRNA基因测序研究的读取次数,每个样品是不是最重要的,因为〜1,000读取可以生成相同的图案作为多亿读取数据集5。话虽如此,台面下generatio Ñ音序器仍然会产生大量的序列数据,以最大产量〜35 MBP(454 GS初级)〜2 GBP(离子洪流PGM),〜10-15 GBP(离子激流腾)〜10 GBP(Illumina的MiSeq)和〜100 GBP(Illumina公司下一步SEQ 500),这是以上对于大多数环境微生物学研究不够。
使用台式测序仪16S rRNA基因扩增新一代测序最近已经应用于各种环境中。例如,所述离子洪流PGM已用于社会铀尾矿该过再循环油砂开采影响沉积物的水产养殖系统的烃污染北极土壤8,9 7,特别高的pH值和低渗透性6,分析和从阿萨巴斯卡河10,11生物膜柳树种植的人类和动物的尸体13-16的污染土壤12和厌氧沼气池17的根际。
jove_content">在这方面的贡献,我们详细我们的方法使用台式下一代定序(离子激流PGM)进行排序内部16S rRNA基因扩增的DNA提取后,16S rRNA基因使用包含域级细菌引物扩增测序接头和独特,样本特异性序列(条码)的扩增子进行纯化,定量并汇集在等摩尔比的混合样品然后被克隆扩增以乳液PCR和测序。结果序列是使用公开可用的生物信息学工具(分析例如,Mothur)。1,16S rRNA基因扩增子文库制备的融合方法
2,扩增子的分离纯化,定量和池
3,乳液PCR和测序
4,基本序列数据分析
纯化的凝胶后,用PCR扩增25个循环,扩增产物通常是在0.2-10.0的浓度纳克于50μl水中。这可能会发生变化很大,这取决于起始的DNA浓度,样品的类型和所用的纯化试剂盒上。它建议保持PCR循环数,以最低可能的,以避免嵌合体的形成,并降低扩增偏倚,牢记,所有样品应使用周期相同数量的扩增。以最小化多克隆读取数和空球和最大化的读取次数,量子比特率应介于0.1和0.3和FAM荧光应高于200使用314芯片上的离子洪流PGM,平均输出大约是结果在Mothur的滤波后0.3-0.5拿手质量的读取。 表2示出了一些典型的故障的过程的每个步骤中为含36多路复用ENVIRON运行后读取心理样品扩增引物靶向16S的V3-4地区和分析使用Mothur。在Mothur的trim.seqs程序生成一个包含通过质量过滤器和一个"* .scrap.fasta"包含该序列没有随着原因通过质量过滤器的序列的"* .trim.fasta"文件为抑制在序列标题。当条形码中的"寡"的文件提供,该命令也将产生一个"* .groups"文件,该文件包含基于条形码序列中的每个序列的组成员。该classify.seqs过程生成一个".tax.summary",可以在Excel中打开。此文件包含的分类单位(以行为单位)对每个样品的摘要(中柱)。此文件可用于下游的统计分析和可视化的群落组成在不同分类级别。在".taxonomy"文件中包含了详细的分类归属于每个序列。在所有36个样品的语系/一流水平的平均社会组成如图1所示。
图1:平均群落组成,在所有样品中的动物门/一流水平。
前进 | TACGGRAGGCAGCAG | |
条形码 | CTAAGGTAAC | Sample01 |
条形码 | TAAGGAGAAC | Sample02 |
条形码 | AAGAGGATTC | Sample03 |
条形码 | TACCAAGATC | Sample04 |
条形码 | CAGAAGGAAC | Sample05 |
条形码 | CTGCAAGTTC | Sample06 |
条形码 | TTCGTGATTC | Sample07 |
条形码 | TTCCGATAAC | Sample08 |
条形码 | TGAGCGGAAC | Sample09 |
条形码 | CTGACCGAAC | Sample10 |
表1。实施"寡"的文件中Mothur使用 。
#的读取 | %上一步 | 平均。每个样品 | |
井数 | 1262519 | - | 35070 |
井珠 | 1114108 | 88.20% | 30947 |
珠模板 | 1112746 | 99.90% | 30910 |
单克隆珠 | 826805 | 74.30% | 22967 |
质量好读(输出的音序) | 782204 | 94.60% | 21728 |
通Mothur过滤器(分平均20质量分数超过50个基点的窗口,最小150个基点的长度) | 372168 | 47.60% | 10,338 |
在GreenGenes的动物门级分类(50%置信度阈值) | 342171 | 91。90% | 9505 |
在GreenGenes家庭一级分类(50%置信度阈值) | 316512 | 92.50% | 8792 |
在GreenGenes属级分类(50%置信度阈值) | 289899 | 91.60% | 8053 |
读取从一个典型的奔跑为36环境样品复用在一个离子洪流314芯片产生的表2编号。
这里介绍的方法是简单的和便宜的,并允许许多实验室访问宏基因组测序的能力。虽然它取决于所采用的测序平台,一旦文库构建很少的手工操作时间是必需的,与大多数的过程中被自动化。对于这里所用的测序平台(离子洪流PGM),该完整的程序可以在工作两天进行。在编写(2013年9月)的那一刻,与上文所详述的例子中,试剂成本如下:PCR检测36个样品的扩增:25元,凝胶净化和的PicoGreen的DNA的36个样品定量:125美元,乳液PCR方法一池扩增子样品:$ 150测序试剂:250元,共计550元或15元的样品或0.0015美元每质量过滤读取。此价格不包含仪器的服务合同,仪器折旧,技术人员的工资和实验室空间使用情况。
帐篷">其中最重要的步骤是泳池的所有产品的等摩尔比,以便检索相似数目的读取为各样品。的PicoGreen定量在这里使用的,但其他的方法可能是合适的,但较不准确( 例如,紫外定量,基于凝胶的量化),即使这样做是最精确的定量和池,有在每个样品中读取数一些可变性,并在典型的运行在表2中详述的,其范围是从4380到32750读出,以平均10338读取,如果处理大量样品(大于40-50)的,单柱凝胶纯化可以通过凝胶纯化来代替在使用平板或纯化珠用严格的尺寸切断( 例如,AMPure珠) 。到目前为止,最常用的下一代测序技术的16S rRNA基因是454在这个协议中所使用的离子激流测序技术是概念上非常类似到454和这两种技术都容易产生相同类型的排序错误。不足为奇的是,它表明,离子激流测序导致测序结果非常相似,454测序10。近年来,许多研究人员研究利用Illumina的技术的16S rRNA基因扩增子测序18,19。在任何情况下,这将是很容易通过改变融合引物的序列以匹配所需要的这些测序技术的适配器和条形码一样,在该方法中最近描述的,以适应当前的协议,用于其他的台式测序仪一样的Illumina MiSeq或454 GS小型对于Illumina的MiSeq 19。另外,研究人员可以按照步骤1和2在这里详细的协议,并发送汇集扩增到乳液PCR和测序将进行测序中心。
16S rRNA基因的读取进行修整和归类使用Mothur,但许多其它的分析,可以执行上16S rRNA基因的扩增子。例如,β多样性可以通过计算在使用中列出的步骤每个样本对之间的Unifrac距离进行评估http://unifrac.colorado.edu/ 20。阿尔法多样性指数和各样品的业务分类学单元的数目可以使用工具内QIIME像AmpliconNoise 21或使用由Huse 等22和可用的内Mothur概述的过程来计算。
这里所用的引物扩增的可变区3和4的16S rRNA基因,但是许多其他区域可以被定位的。在本研究中,16S rRNA基因是从植物材料中扩增和引物的选择是为了避免叶绿体16S rRNA基因23,24的扩增。有各种各样的变化是在产品长度,分类能力和有效性25,26的术语可用的其它引物。然而,在所有的情况下200-400 bp的读出的16S rRNA基因不能可靠归类在种的水平,并分析仅限于属和更高的分类学水平。如果需要物种水平上的信息,如cpn60和的rpoB基因27,28其它基因可能是更合适的。未来大幅下降的测序,并增加对分析工具的权力的成本可能会使得人们能够通过元基因组鸟枪取代16S rRNA基因序列,但在那之前的16S rRNA基因测序仍然环境微生物的黄金标准。
The authors have nothing to disclose.
Development of the method presented here has been carried out with various sources of funding, including Genome Canada and Genome Quebec, Environment Canada STAGE program and internal NRC funds.
Name | Company | Catalog Number | Comments |
Ion 314 Chip Kit v2 | Life Technologies | 4482261 | |
Ion PGM Sequencing 200 Kit v2 | Life Technologies | 4482006 | |
Ion PGM Template OT2 200 Kit | Life Technologies | 4480974 | |
HotStarTaq Plus Master Mix Kit | Qiagen | 203646 | |
Primers and probes | IDT | NA | |
Qiaquick Gel Extraction Kit | Qiagen | 28704 | |
BSA 20 mg/ml | Roche | 10,711,454,001 | |
Dynabeads MyOne Streptavidin C1 | Life Technologies | 65001 |
请求许可使用此 JoVE 文章的文本或图形
请求许可This article has been published
Video Coming Soon
版权所属 © 2025 MyJoVE 公司版权所有,本公司不涉及任何医疗业务和医疗服务。