我们使用病毒基因测序来尝试和了解病毒来自哪里,以及病毒是如何传播的。为了实时使用这些数据,例如在疫情期间,我们必须确切地了解我们提供的数据的准确性。这些技术的主要优点是价格相对便宜,速度快,并且能够实时进行基础编码,可用于现场测序。
此方法可用于及时生成序列数据,例如,可用于确定多种病原体的来源。对于第一次使用的用户来说,这种技术可能很复杂,并且需要基本的 Unix 知识。特别是用于安装不同的软件包。
此方法的可视化将帮助用户确定其特定排序协议的错误率。并回答研究问题。序列运行在连接到 MinIT 的 MinION 上启动。
在 Nanopore 平台上预造序列后,将数据负载加载到 Porechop 中。为防止污染和增强准确性,请使用要求下划线 2,下划线条形码标志并输入命令,如指示。去多路复用后,使用 cutadapt 删除长度小于 75 核苷酸的底端序列和序列,如指示。
使用 Minimap2 使用 Minimap2 根据不同参考应变的面板映射去多路复用序列读取。并使用 Samtools 生成共识序列。对于基于参考的对齐方式,必须预先形成爆炸,并搜索生成的共识序列,以确定最接近的参考应变。
然后重复基于参考的对齐方式,以最接近的参考应变作为参考。要确定所需的读取覆盖率以补偿 Nanopore 测序中的误差配置文件,请选择一个安培孔序列映射,并使用 Minimap2 将纳米孔读取映射到此安培孔。使用 Samtools 仅选择映射到 Amplicon26 的读取映射,并使用指示中的命令将 bam 文件转换为 fastq。
随机选择 200 个序列的子集读取一千次。所有随机选择的顺序读取都与安培康26对齐。使用 KMA 映射序列读取,并使用 BC 纳米标志所示的纳米孔测序优化设置立即生成共识序列。
要检查生成的共识序列,请使用指示的命令。若要在标题下的统计点 txt 中显示错误率,错误率不匹配映射的基础,请使用指示的命令。要显示每个周期标题下显示的 indel 数,请使用指示的命令。
与光照测序相比,将较新的流式处理单元与基本颜色触发器结合使用,读取覆盖率为 40 倍,结果结果相同。读取覆盖率为 30 倍,误差率为 0.02%,相当于每 585,000 个核苷酸中测序的一个错误。虽然读取覆盖率为 20 次,但每 63、529 个核苷酸中就产生一个错误。
读取覆盖率为 10 倍,每 3,312 个核苷酸序列中产生一个错误。这意味着每四个乌苏图病毒基因组中超过3个核苷酸被称为错误。读取覆盖率超过 30 次时,不会观察到任何 indel。
读取覆盖率为 20 倍,可检测一个 indel 位置,而读取覆盖率为 10 倍,则导致 29 个位置的 indel。需要记住的最重要的事情是,虽然并不总是很明显,但软件中的更新经常发生,并且会影响结果。有几个软件可以使用的选项。
我们已经演示了最常用的程序。但是,不同的软件和不同版本的软件可能会导致不同的结果。我们向您展示了一个示例,说明我们如何检查我们生成序列数据的质量。
这对于可靠的疫情支持至关重要。