该综合方案指导如何生成不同尿细菌的近基因组,并使没有编码经验的读者能够成功实施基于终端的基因组组装和分析管道。完整的基因组组装能够发现有助于共生和尿路致病细菌中定植和毒力的基因。近距离基因组提供了对基因组结构和移动遗传元件的洞察。
混合基因组组装方法可以应用于从其他解剖位点或环境生态位分离的任何可培养细菌,以提供对基因组内容和结构的类似见解。按照实验方案和制造商指南准备一个双链DNA库,并通过向DNA库中添加2.5倍体积的顺磁性珠子,然后轻轻轻轻地轻拂管子以混合内容物来继续清理。以2, 000倍G短暂旋转样品,并将样品在室温下在旋转器上放置5分钟,然后将磁珠沉淀在磁铁上。
接下来,用250微升新鲜制备的70%乙醇在无核酸酶水中洗涤沉淀两次,而不会干扰沉淀。在洗涤过程中将管子留在磁铁上。每次洗涤后吸出乙醇,然后以2, 000倍G短暂旋转样品,然后将其返回到磁铁中。
移出残留的乙醇,让沉淀干燥30秒。干燥后,将沉淀重悬于60至70微升无核酸酶水中,并在室温下孵育样品两分钟,然后将样品沉淀在磁铁上直到洗脱物清晰。将洗脱液转移到干净的1.5毫升微量离心管中。
使用荧光计定量浓缩的双链DNA池,然后在65微升最终体积中制备700纳克样品的等分试样,以进入适配器连接步骤,并将池的其余部分保留在四摄氏度下,以便在第一次运行完成后进行第二次运行。根据制造商的说明继续连接适配器。要继续进行测序,请混合启动缓冲液并启动流通池。
准备DNA文库溶液并将样品滴加到上样口。启动排序运行。打开用于排序的操作软件,单击开始按钮,然后输入实验的名称。
转到"继续选择试剂盒"以选择所使用的相应文库制备试剂盒和条形码扩展包,然后单击"继续运行选项"。如果计划为第二次运行准备足够的库,请将运行长度从默认的 72 小时调整为 48 小时,然后按继续基调用。检查配置快速基调用中的基调用选项。
将条形码设置为启用,以便输出 FASTQ 将从条形码序列中修剪出来,并根据条形码解复用到单独的目录中。单击继续输出。接下来,选择保存输出排序数据的位置。
如果仅保存 FASTQ 输出,则预计大约需要 30 到 50 GB 的数据,如果保存 FAST5 输出,则预计会有超过 500 GB 的数据。如果计划在排序后继续进行手动过滤,请取消选中过滤选项 Qscore seven in 读取长度未过滤。否则,请选中该选项。
转到继续运行设置选项卡以查看所有设置。如果设置正确,请单击开始按钮。否则,请单击"返回"以进行任何必要的调整。
在 long reads 目录中,为运行中使用的每个条形码创建新目录。将与每个条形码对应的所有 fastq 文件复制到相应的文件夹中。合并每次运行的每个条形码的所有 fastq 文件。
合并文件后,打开终端并使用 cd 命令导航到长读取目录中的条形码目录。要将每个条形码的所有 fastq 文件连接到一个 fastq 文件中,请执行该命令并为每个条形码重复该过程。使用 NanoStat 通过执行命令来评估样本的读取质量,然后通过将输出复制到文本或 Word 文件中以供将来参考来记录结果。
保存结果后,使用 NanoFilt 过滤 MinION 读取,通过执行命令丢弃 Q 小于 7 且长度小于 200 的读取。在生成的修整文件上,使用命令运行 NanoStat。通过将输出复制到文本或 Word 文件中来记录结果,并与以前的结果进行比较,以确保筛选成功。
对排序运行中使用的每个条形码重复这些步骤。为了生成混合基因组组装,将短读文件和长读文件组织到一个名为trimmed_reads的目录中。因此,该目录包含以前生成的 fastq。
gz 文件,用于修剪的长读取和两个 fastq。gz 文件作为 R1 和 R2,用于修剪短读。导航到使用终端中的 cd 命令存储读取文件的目录trimmed_reads。
进入正确的目录后,压缩两个短读取文件以存储在 fastq 中。通过执行命令来格式化 gz。对 R1 和 R2 重复该步骤。确保所有读取的文件都在 fastq 中。
gz 格式并验证所有文件是否与同一隔离点匹配。通过运行命令,使用独轮车开始混合程序集。运行完成后,检查独轮车。
日志文件,以确保没有错误。记录生成的上下文的数量、大小以及完整或不完整状态。如果在独轮车日志中标识了不完整的上下文,请通过将标志添加到命令中以粗体模式重新运行独轮车。
打开绷带并单击文件,然后选择荷载图并选择组件。gfa 文件,该文件之前已保存到独轮车生成的unicycler_output_directory。加载文件后,单击左侧工具栏上的绘制图形按钮,并通过检查重叠群的连接和组织方式来评估组件是否完成。
在终端内导航到使用 cd 命令存储独轮车输出的文件夹。然后通过执行命令来运行 quast 协议。查看 quast 在输出目录中生成的报告quast_output_directory。
在终端内导航到使用 cd 命令存储独轮车输出的文件夹,然后通过执行该命令运行 prokka。通过打开 tsv 表并将生成的 gff 文件上传到序列分析软件中来查看注释。可视化和分析软件中的注释。
在具有代表性的凝胶图像中,描述了基因组DNA或gDNA提取结果。可以观察到完整gDNA的成功提取和分离。还描述了显示片段化 gDNA 和 RNA 污染的不成功提取。
细菌的基因组组装图由独轮车杂交从头组装生成,并通过绷带可视化。催产克雷伯菌KoPF10的完整基因组显示单个闭合染色体,肺炎克雷伯菌KpPF25的完整基因组由一条闭合染色体和五个闭合质粒组成。肺炎克雷伯菌KpPF46的不完全染色体由两个相互连接的重叠群组成。
Geneious Prime为催产克雷伯菌KoPF10和肺炎克雷伯菌KpPF25的完整基因组生成的组装图显示了沿质粒骨架的彩色箭头表示的注释基因。为确保流池加载成功,请使用建议的设置过滤长读数,并确保所有文件都在 fastq 中。gz 格式。
使用属于同一示例的文件运行正确的 Unicycler 命令。