Method Article
该协议详细介绍了尿细菌培养,测序和 从头 杂交基因组组装的综合方法。它为生成完整的圆形基因组序列提供了一种可重复的程序,可用于研究有助于尿定植、发病机制和抗菌素耐药性传播的染色体和染色体外遗传元件。
完整的基因组序列为了解泌尿微生物的遗传多样性和独特定植因子提供了有价值的数据。这些数据可能包括移动遗传元件,如质粒和染色体外噬菌体,它们有助于抗菌素耐药性的传播,并使尿路感染(UTI)的治疗进一步复杂化。除了提供基因组结构的精细分辨率外,完整的闭合基因组还允许进行详细的比较基因组学和进化分析。由于现有测序技术的局限性 ,从头开始 生成完整基因组长期以来一直是一项具有挑战性的任务。配对端下一代测序(NGS)产生高质量的短读数,通常导致准确但片段化的基因组组装。相反,纳米孔测序提供质量较低的长读数,通常会导致容易出错的完整组件。这些错误可能会妨碍全基因组关联研究或提供误导性的变异分析结果。因此,结合短读和长读的混合方法已成为实现高度准确的闭合细菌基因组的可靠方法。本文报道的用于培养多种尿菌的综合方法,通过16S rRNA基因测序进行物种鉴定,提取基因组DNA(gDNA),以及分别通过NGS和Nanopore平台生成短读和长读。此外,该方法还描述了用于生成注释的完整基因组序列的质量控制,组装和基因预测算法的生物信息学管道。生物信息学工具的组合可以选择高质量的读取数据,用于杂交基因组组装和下游分析。该协议中描述的用于杂交 从头 基因组组装的简化方法可以适用于任何可培养细菌的使用。
泌尿微生物组是一个新兴的研究领域,它打破了长达数十年的误解,即尿路在健康个体中是无菌的。尿微生物群的成员可用于平衡尿液环境并预防尿路感染(UTI)1,2。泌尿致病细菌侵入尿路,并采用多种毒力机制来取代常驻微生物群,定植尿路上皮,逃避免疫反应并抵消环境压力3,4。尿液是一种营养相对有限的培养基,其特征在于高渗透压,有限的氮和碳水化合物可用性,低氧合和低pH 5,6,7。尿液也被认为是抗菌的,由高浓度的抑制性尿素和抗菌肽如人cathelicidin LL-378组成。调查常驻细菌和泌尿道病原体在尿路定植的机制对于进一步了解尿路健康和制定UTI治疗的新策略至关重要。此外,随着一线抗菌疗法的失败变得越来越普遍,监测携带抗菌素耐药性决定因素的移动遗传元件在尿细菌种群内的传播变得越来越重要9,10。
为了研究尿细菌的基因型和表型,它们的成功培养和随后的全基因组测序(WGS)势在必行。培养依赖性方法对于检测和鉴定尿液样品中的活微生物是必要的11。标准临床尿培养包括将尿液接种到5%绵羊血琼脂(BAP)和麦康基琼脂上,并在35°C下有氧孵育24小时12。然而,由于检测阈值为≥105 CFU / mL13,许多尿微生物群的成员没有通过这种方法报告。改进的培养技术,如增强定量尿培养(EQUC)11, 采用不同尿量,孵育时间,培养基和大气条件的各种组合来鉴定标准尿培养物通常遗漏的微生物。该协议中描述的是EQUC的修改版本,在这里称为改良增强尿培养方案,其能够使用选择性培养基和最佳大气条件培养各种尿细菌和尿路病原体,但不是固有的定量。尿液细菌的成功分离使得能够提取用于下游WGS和基因组组装的基因组DNA(gDNA)。
基因组组装,特别是完整的组装,能够发现可能有助于常驻微生物群和泌尿致病细菌的定植,生态位维持和毒力的遗传因素。基因组组装草案包含大量连续序列(重叠群),这些序列可能包含测序错误并且缺乏方向信息。在完整的基因组组装中,每个碱基对的方向和准确性都得到了验证14.此外,获得完整的基因组序列可以深入了解基因组结构,遗传多样性和移动遗传元件15。仅短读物可以识别重要基因的存在与否,但可能无法确定其基因组背景16。随着牛津纳米孔和PacBio等长读测序技术的实现,生成细菌基因组的闭合从头组装不再需要费力的方法,例如通过多重PCR17,18手动关闭从头组装。下一代短读测序和纳米孔长读测序技术的结合允许以相对较低的成本轻松生成准确,完整和封闭的细菌基因组组装19。短读测序产生准确但碎片化的基因组组装体,通常平均由40-100个重叠群组成,而Nanopore测序产生长度约为5-100 kb的长读数,这些读数不太准确,但可以作为支架加入重叠群并解析基因组合成。利用短读和长读技术的混合方法可以产生准确和完整的细菌基因组19。
这里描述的是一个全面的方案,用于从人尿液中分离和鉴定细菌,基因组DNA提取,测序和使用混合组装方法的完整基因组组装。该协议特别强调了正确修改由短读和长读测序生成的读数所需的步骤,以便准确组装封闭的细菌染色体和染色体外元件(如质粒)。
作为机构审查委员会批准的研究19MR0011(UTD)和STU 032016-006(UTSW)的一部分,从同意妇女收集的尿液中培养细菌。
1. 改良增强型尿培养
注意:所有培养步骤必须在无菌条件下进行。对所有器械、溶液和培养基进行灭菌。用70%乙醇清洁工作区域,然后设置本生燃烧器,并在靠近火焰的地方小心地工作,以减少污染的机会。或者,可以使用II类生物安全柜来维持无菌环境。穿戴适当的个人防护装备(PPE),以避免接触潜在的致病微生物。
2. 通过16S rRNA基因桑格测序鉴定细菌种类
注意:微生物身份可以使用基质辅助激光解吸电离飞行时间质谱(MALDI-TOF)20进行确认。
3. 基因组DNA(gDNA)的提取
注:本节利用 材料表中 引用的gDNA提取试剂盒中提供的试剂和离心柱,从不同细菌物种中高产提取优质基因组DNA。下面提供了建议的修改和说明。
4. 评估提取的gDNA的质量
5. 配对端的下一代短读测序和文库制备
注:短读测序可以在不同的读取长度和方向上对各种仪器进行。建议对细菌 WGS 进行 150 bp(300 周期)配对测序。文库制备和测序均可外包给核心设施或商业实验室。
6. 纳米孔 MinION 测序文库制备
7. 评估和准备阅读材料
注意:推荐的目录结构如图 4 所示。在继续下面的计算步骤之前,创建 在桌面中找到的目录,即Long_Reads,Short_Reads和Trimmed_Reads。
8. 生成杂交基因组组装
注:以下装配管线利用独轮车19、28、29、30组合了第7.1节和第7.2节中准备的短读和长读(图3)。安装独轮车及其依赖项并执行以下命令。在步骤 7.1.5 中导出的短读文件假定trimmed_short_file命名。R1.fastq和trimmed_short_file。R2.fastq 用于简化。
9. 评估装配质量
注意:以下协议使用Bandage31 和QUAST32,这两个程序必须在使用前设置(图2 和 图4)。下载后不需要安装绷带,QUAST需要熟悉基本的命令行用法。还建议使用基准通用单拷贝正交学(BUSCO)33评估基因组完整性。
10. 基因组注释
注意:下面的注释管道使用 Prokka34,这是一个命令行工具,必须在使用前安装。或者,通过自动GUI K-Base(材料表)使用Prokka,或通过Web服务器RAST35注释基因组。如果将基因组沉积到NCBI中,它们将使用原核基因组注释管道(PGAP)36自动注释。
11. 建议的数据民主化做法
该方案已针对属于 图1中所列属的尿细菌的培养和测序进行了优化。并非所有的尿细菌都可以通过这种方法培养。培养基和条件由 图1中的属指定。gDNA完整性的示例性凝胶电泳评估如图 2所示。 图3描述了用于测序读取处理,基因组组装和注释的生物信息学管道的概述。 图 4 中提供了计算目录结构指南,以简化协议理解并为成功的组织提供框架。此外,还包括由该协议产生的两种克雷伯菌属的代表性完整基因组 ,肺炎 克雷伯菌和 催产衣原体。 图5 提供了这些组装体的表示形式,还包括一个额外的不完整的例子 肺炎克雷伯菌 基因组。每个完全注释的完整基因组的详细概述如图 6所示。最后, 表1 提供了测序读取统计数据的摘要,以提供对原始和修剪数据的广泛理解,这些数据足以生成高质量的封闭基因组组装。此外,两个代表性的关键参数完全完成克雷伯菌 属。列出了基因组。基因组和原始数据被存放在BioProject PRJNA683049下的Genbank中。
图1:不同尿液属的改良增强尿培养。可用于培养不同尿液属的琼脂和液体肉汤的图表。建议所有培养均在35°C下进行,如第1.1小节所述。圆圈代表适合培养特定属的培养基,任意选择颜色以区分一种培养基类型与另一种培养基类型。CDC-AN BAP(红色),CDC厌氧菌绵羊血琼脂;5%绵羊BAP(橙色),绵羊血琼脂;BHI(绿色),脑心脏输注;TSB(黄色),胰蛋白酸大豆汤;CHROMagar 方向(蓝色)。a阴道加德纳菌应在HBT双层G.阴道培养中培养选择性琼脂在微嗜酸气氛中和特殊肉汤培养要求下培养44。 b乳酸杆菌应在微嗜酸气氛中在5%兔-BAP平板和NYCIII肉汤上培养。c乳酸杆菌属。在微嗜酸性条件下,可在 MRS 上培养。请点击此处查看此图的放大版本。
图2:琼脂糖凝胶图像的基因组DNA提取。 描绘gDNA提取结果的代表性凝胶图像。(A) 泳道 1: 1 kb 阶梯, 泳道 2: 完整 gDNA 代表成功提取, 泳道 3: 涂抹表示片段化 gDNA。(B) 泳道 1:1 kb 阶梯,泳道 2 和 3:rRNA 污染由 1.5 kb 至 3 kb 之间的两个条带表示。 请点击此处查看此图的放大版本。
图3:混合基因组组装工作流程。 从读取质量控制和预处理到装配注释的步骤示意图。读取修剪可消除不明确和低质量的读取。指示 Q 评分和长度参数,并表示保留的读数。组装利用短读和长读来生成杂交 从头 基因组组装。使用指定的工具和参数根据完整性和正确性评估装配质量。最终的基因组组装对所有基因和感兴趣的特定位点进行注释。 请点击此处查看此图的放大版本。
图4:生物信息学目录结构指南。 用于处理短读和长读、混合组装、基因组注释和 QC 的推荐目录和文件组织的示意图。关键命令行数据处理步骤在相应的文件和目录旁边突出显示。引出命令和标志(粗体)、输入文件(蓝色)、输出文件或目录(红色)、用户输入(如文件命名约定(洋红色)。 请点击此处查看此图的放大版本。
图5:绷带的基因组组装图。(A)催产克雷伯菌KoPF10和(B)肺炎克雷伯菌KpPF25的代表性完整基因组组装图和(C)肺炎克雷伯菌KpPF46的不完全基因组组装图。KoPF10的完整基因组显示了单个闭合染色体,KpPF25的完整基因组由一条闭合染色体和五条闭合质粒组成。KpPF46的不完全染色体由两个相互连接的重叠群组成。独轮车混合从头组件生成由绷带可视化的组件图。组装图提供了基因组的简单示意图,表明通过连接单个重叠群两端的连接子连接闭合的染色体或质粒。存在多个互连的重叠群表示装配不完整。重叠群的大小和深度也可以在绷带中注明。请点击此处查看此图的放大版本。
图6:带注释的杂交组件的完整基因组图谱。 Geneious Prime为(A)K. oxytoca KoPF10和(B)K. pneumoniae KpPF25的完整基因组生成的组装图显示了沿质粒骨架的彩色箭头表示的注释基因。为了简单起见,染色体仅显示rRNA和tRNA基因。基因组注释使用Prokka进行,如该协议第10节所示。 请点击此处查看此图的放大版本。
表1:代表性克雷伯菌 属完整组装特性。 提供 催产衣原 体KoPF10和 肺炎克雷伯菌 株KpPF25的组装参数。为两种测序技术指定了修剪前后的读取次数。N50 仅用于长读取,因为短读取的长度是受控的。使用质粒查找器 v2.1 肠杆菌科数据库预测的质粒,参数设置为 80% 身份和 60% 长度。a MLST,多位点序列类型。 b 光盘,编码序列。 c 使用质粒查找器v2.1肠杆菌科数据库预测的质粒复制子,参数设置为80%身份和60%长度。 d 牛津纳米孔技术公司(ONT)存入的读取数据。 e Illumina存入读取数据。请点击此处下载此表格。
这里描述的综合混合基因组组装方案为成功培养各种尿液微生物群和尿路病原体以及其基因组的完整组装提供了一种简化的方法。细菌基因组的成功WGS始于分离各种有时挑剔的微生物,以提取其基因组DNA。迄今为止,现有的尿培养方案要么缺乏检测许多尿种的必要敏感性,要么涉及需要延长时间和资源的冗长而广泛的方法11。所描述的改良增强型尿培养方法为成功分离属于17种常见尿属的细菌(包括潜在致病性或有益的共生菌种,以及兼性和专性需氧或厌氧菌)提供了简化而全面的方案。这反过来又为细菌基因组的准确测序和组装以及关键的表型实验提供了必要的起始材料,这有助于了解泌尿健康和疾病。此外,这种改进的培养方法为尿液标本中发现的活微生物提供了更明确的临床诊断,并允许其生物库用于未来的基因组研究。但是,此协议并非没有限制。它可能需要较长的孵育时间,具体取决于生物体以及使用资源,例如缺氧室或可能不易获得的受控培养箱。使用厌氧气体包提供了一种替代解决方案,但这些解决方案成本高昂,并且并不总是产生持续和受控的环境。最后,培养偏倚以及样本多样性可能允许特定生物体和泌尿道病原体胜过挑剔的细菌。尽管有这些局限性,但这种方法使多种尿液细菌的培养成为可能。
随着下一代测序技术的进步,基因组测序越来越受欢迎,这大大提高了测序数据的产量和准确性14,15。再加上用于数据处理和从头组装的算法的发展,完整的基因组序列在新手和专家科学家的指尖15,45。全基因组提供的整体基因组组织知识提供了重要的进化和生物学见解,包括基因复制,基因丢失和水平基因转移14。此外,对抗菌素耐药性和毒力很重要的基因通常定位于移动元件上,这些元件通常在基因组组装草案15,16中未得到解决。
本文的方案遵循混合方法,用于组合来自短读和长读平台的测序数据,以产生完整的基因组组装。虽然专注于尿液细菌基因组,但该程序可以适应来自各种分离来源的各种细菌。该方法的关键步骤包括遵循适当的无菌技术,并利用适当的培养基和培养条件分离纯尿细菌。此外,提取完整的高产量gDNA对于生成没有污染读数的测序数据至关重要,这些读数可能会阻碍组装成功。后续的文库制备方案对于生成足够长度和深度的高质量读数至关重要。因此,在库制备长读测序期间小心处理gDNA非常重要,因为该技术的最大好处是生成没有理论长度上限的长读取。还概述了测序读数的适当质量控制(QC)部分,可消除噪声数据并改善组装结果。
尽管DNA分离,文库制备和测序成功,但某些物种的基因组结构的性质仍可能为闭合基因组组装的产生提供障碍45,46。重复序列通常使装配计算复杂化,尽管读取数据很长,但这些区域可能以低置信度解决,或者根本不解决。因此,长读取必须平均长于基因组中最大的重复区域或覆盖率必须高(>100x)19。一些基因组可能仍然不完整,需要手动方法才能完成。然而,杂交组装的不完整基因组通常由比短读草稿基因组更少的重叠群组成。调整装配算法的默认参数或遵循更严格的读取 QC 截止值可能会有所帮助。或者,一种建议的方法是将长读数映射到不完整的区域,以寻找最可能的组装路径的证据,然后利用扩增区域的PCR和Sanger测序确认路径。建议使用Minimap2进行映射读取,并且Bandage提供了一个有用的工具,用于可视化沿组合重叠群的映射读取,为重叠群链接47提供证据。
生成完整基因组的另一个挑战在于对命令行工具的熟悉程度和舒适度。许多生物信息学工具的开发旨在为任何用户提供计算机会;但是,它们的使用依赖于对 UNIX 和编程基础知识的理解。该协议旨在提供足够详细的说明,使没有命令行经验的个体能够生成封闭的基因组组装并对其进行注释。
作者没有什么可透露的。
我们感谢Moutuse Jubaida Islam博士和Luke Joyce博士对该协议的贡献。我们还要感谢德克萨斯大学达拉斯分校基因组中心的反馈和支持。这项工作由韦尔奇基金会资助,奖项编号为AT-2030-20200401给N.J.D.,由美国国立卫生研究院资助,奖项编号R01AI116610给K.P.,以及由Felecia和John Cain妇女健康主席,由P.E.Z.持有。
Name | Company | Catalog Number | Comments |
Equipment: | |||
Bioanalyzer 2100 | Agilent | G29398A | Optional but recommended |
Centrifuge | Eppendorf | -- | Any centrifuge for spinning conicals and microcentrifuge tubes (e.g. Models 5810R/5424R) |
Electrophoresis | BioRad Laboratories | 1645070 | |
Gel Imaging System | BioRad Laboratories | ChemiDoc models | |
Incubator | ThermoFisher Scientific | -- | Any CO2 Incubator (e.g. Thermo Forma model 3110) |
Magnetic Rack | New England BioLabs | S15095 | 12-tube rack |
MinION | Oxford Nanopore Technologies | -- | |
Nanodrop | ThermoFisher Scientific | ND-ONE-W | |
NextSeq 500 | Illumina | SY-415-1002 | Other Illumina models are acceptable |
Plate Reader | BioTek | -- | Synergy H1 |
Qubit fluorometer | ThermoFisher Scientific | Q33238 | |
Rotator | Benchmark Scientific | H2024 | |
Thermocycler | ThermoFisher Scientific | -- | Any thermocycler for PCR reactions (e.g. ProFlex PCR system) |
Materials: | |||
10X Phosphate Buffered Saline (PBS) | Fisher Scientific | BP3991 | |
10X TBE buffer | -- | -- | 1M Tris,1M Boric Acid,0.2M EDTA (pH 8.0) |
1429R primer | Sigma Aldrich (Custom oligos) | -- | GGTTACCTTGTTACGACTT |
1kb Ladder | VWR | 101228-494 | |
1M Tris-Cl (pH 7.5) | ThermoFisher Scientific | 15567027 | |
6x Loading dye | Fisher Scientific | NC0783588 | |
8F primer | Sigma Aldrich (Custom oligos) | -- | AGAGTTTGATCCTGGCTCAG |
Agar | Fisher Scientific | BP1423-2 | |
Agarose | BioRad Laboratories | 63001 | |
AMPure XP Beads | Beckman Coulter | A63880 | |
Anaerobe Pouch System - GasPak EZ | BD Diagnostic Systems | B260683 | |
Boric Acid | Fisher Scientific | A73-500 | |
Brain Heart Infusion Broth | BD Diagnostic Systems | 212304 | |
CDC Anaerobe 5% Sheep Blood Agar | BD Diagnostic Systems | L007357 | |
CHROMagar Orientation | BD Diagnostic Systems | PA-257481.04 | |
DNeasy Blood & Tissue | QIAGEN | 69504 | |
DreamTaq Master Mix | ThermoFisher Scientific | K1081 | |
Dry Anaerobic Indicator Strips | BD Diagnostic Systems | 271051 | |
EDTA | Fisher Scientific | S311-500 | |
Ethanol 200 Proof | Sigma Aldrich | E7023 | For molecular biology |
Ethidium Bromide | ThermoFisher Scientific | BP130210 | |
Flow cell priming kit | Oxford Nanopore Technologies | EXP-FLP002 | |
Flow cell wash kit | Oxford Nanopore Technologies | EXP-WSH003 | |
Gel Extraction Miniprep Kit | BioBasic | BS654 | |
Ligation sequencing kit | Oxford Nanopore Technologies | SQK-LSK109 | |
Lysozyme | Research Products International Corp | L381005.05 | |
Mutanolysin | Sigma Aldrich | M9901-5KU | |
Native barcoding expansion 1-12 | Oxford Nanopore Technologies | EXP-NBD104 | |
NEB Blunt/TA Ligase Master Mix | New England BioLabs | M0367L | |
NEBNext FFPE DNA Repair Mix | New England BioLabs | M6630L | |
NEBNext quick ligation buffer | New England BioLabs | B6058S | |
NEBNext Ultra II End repair / dA-tailing module | New England BioLabs | E7546L | |
Nextera DNA CD Indexes | Illumina | 20018708 | |
Nextera DNA Flex Library Prep - (M) Tagmentation | Illumina | 20018705 | |
Nuclease-free water | Sigma Aldrich | W4502 | |
Qubit 1X dsDNA HS Assay Kit | ThermoFisher Scientific | Q33230 | |
Qubit Assay Tubes | ThermoFisher Scientific | Q32856 | |
Quick T4 DNA Ligase | New England BioLabs | E6056L | |
R9 Flow cell | Oxford Nanopore Technologies | FLO-MIN106D | |
RNase A | ThermoFisher Scientific | EN0531 | |
Sheep Blood | Hemostat Laboratories | DS13250 | |
TE buffer | -- | -- | 10mM Tris, 1mM EDTA (pH 8.0) |
Triton X-100 | Sigma Aldrich | T8787 | |
Tryptic Soy Broth | BD Diagnostic Systems | 211825 | |
Software & Bioinformatic Tools: | |||
Bandage | -- | -- | https://rrwick.github.io/Bandage/ |
Center for Genomic Epidemiology | -- | -- | http://www.genomicepidemiology.org/ |
CLC Genomics Workbench 12 | QIAGEN | -- | |
CRISPRcasFinder | -- | -- | https://crisprcas.i2bc.paris-saclay.fr/ |
FastQC | -- | -- | https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ |
Geneious Prime | Geneious | -- | |
gVolante (BUSCO) | -- | -- | https://gvolante.riken.jp/ |
Kbase Prokka Wrapper | -- | -- | https://kbase.us/applist/apps/ProkkaAnnotation/annotate_contigs/release |
Minimap2 | -- | -- | https://github.com/lh3/minimap2 |
MinKNOW | Oxford Nanopore Technologies | -- | |
NanoFilt | -- | -- | https://github.com/wdecoster/nanofilt |
NanoStat | -- | -- | https://github.com/wdecoster/nanostat |
PHASTER | -- | -- | https://phaster.ca/ |
Prokka | -- | -- | https://github.com/tseemann/prokka |
QUAST | -- | -- | http://quast.sourceforge.net/quast |
Trim Galore | -- | -- | https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/ |
Trimmomatic | -- | -- | http://www.usadellab.org/cms/?page=trimmomatic |
Unicycler | -- | -- | https://github.com/rrwick/Unicycler#necessary-read-length |
请求许可使用此 JoVE 文章的文本或图形
请求许可This article has been published
Video Coming Soon
版权所属 © 2025 MyJoVE 公司版权所有,本公司不涉及任何医疗业务和医疗服务。