我们的协议非常重要,因为它可用于识别无法与共同纯化序列分离的基因组序列,而共同纯化序列本身可能只有部分已知。这种技术的主要优点是,它便宜,使用大部分免费软件,可以下载,以及灵活。你可以把它应用到许多生物问题。
潜在的应用包括识别细菌疫苗靶点和识别其序列与已知微生物截然不同的病毒。只要没有基因组靶的参考序列可用,就可以应用于任何不能以实验方式分离未知基因的系统。这种技术需要一些试验和错误,所以耐心是重要的。
您可能需要麻烦拍摄程序。您可以使用不同于我们这里描述的程序。尽可能使用用户手册。
此方法的可视化演示非常有用,因为计算工作依赖于对命令行编程结构的基本了解。首先,使用 Trimmomatic 0.32 卸下照明适配器和低质量底座。使用梨版本 0.9.11 使用默认参数从修剪输出配对读取创建高质量的合并读取。
然后使用爬行动物版本 1.1 错误更正通过梨产生的读取。最后在默认模式下使用三一版本 2.4.0 来组装校正序列。对于链特定的库,请使用SS_lib_type参数。
输出是一个 FASTA 文件,将放置在名为"trinity_output"制作参考序列的 BLAST 数据库nucleotide_reference。快速在命令行。
BLAST 将组装的查询与引用数据库匹配。若要获取输出文件,请使用BLAST_results。txt 要生成使用 Python 脚本进行子序列处理步骤所需的表格输出,请使用 outfmt 6 提高字符串性,请使用组件中的蛋白质序列作为 BLAST 查询,并翻译核苷酸 BLAST,该查询执行核苷酸数据库的六向转换。
要获取查询的蛋白质序列,请运行跨数据器。Long0rfs 命令,用于标识从组装的查询序列中最长的开放读取帧。现在运行 tblastn 。
如有必要,确保使用具有适当代码选项的db_gencode为所研究的生物体选择正确的遗传密码。如果有高质量的蛋白质参考,请使用与爆炸的蛋白质匹配,而不是 tblastn 制作蛋白质参考的 BLAST 数据库。请确保将结果保存为用于下游处理的文件,并使用表格输出来确保 Python 脚本可以正确分析它们。
现在,使用减法 Python 脚本删除任何匹配的序列。若要将读取映射到程序集,请使用 BWA-MEM 版本 0.7.12 或 bowtie 2 将下载的原始读取映射到查询程序集。首先,索引程序集,然后映射读取。
输出为 SAM 格式。运行 Python 脚本删除"已映射"。py 使用 SAM 文件作为输入。
这将标识查询序列的名称,而不提供任何匹配的读取,并将它们保存到新的文本文件中。上一步的输出是 txt 文件中序列名称的列表。使用这些序列提取 FASTA 文件。
输出将是一个快速文件。使用 Genius 手动确定最佳底像序列。突出显示前底像的 21 到 28 个碱基对的候选序列,避免运行任何基座的四个或更多。
尝试以具有所有基对相当均匀组合的区域为目标。在三个底端的单个 G 或 C 是有益的, 有助于锚定底。单击屏幕右侧的"统计"选项卡,在突出显示候选区域时查看该序列的估计熔化温度。
目标是在 55 到 60 摄氏度之间的熔化温度,同时避免重复,并长时间运行 G C.选择反向底像以相同的方式,位于 150 至 250 基对三个前底向的底数。虽然底像长度不需要匹配,但预测的熔化温度应与前进底像的长度尽可能接近。在菜单选项中突出显示序列时,请确保在 Genius 中右键单击以反转序列。
另一种方法是使用"底图设计"功能,该函数位于"序列"窗口中的顶部工具栏中。在目标区域下插入该区域以放大。在"特征"选项卡下,插入所需尺寸、熔化温度和百分之一 G C,然后单击"确定"以生成底向器。
要对剩余序列进行定量 PCR 验证,首先为三联的每个模板准备反应混合物,使用我们的 SYBR 绿色主混合、前向和反向底因以及水,总体积为 25 微升。运行 qPCR 程序,根据先前验证的温度和延长时间进行通知。至少应首次使用 qPCR 中的底像来验证单个 DNA 产品的扩增时,应生成最终变性曲线。
测量 qPCR SYBR 绿色信号相对于 Actin 按 Ct 所有情况,计算 2 个与 Actin 的平均值和标准偏差。执行端点凝胶电泳,通过 qPCR 确认正确的产品尺寸检测。在这里,运行 25 微升的 qPCR 产品与 5 微升 6X 格利特醇染料混合在 2%TAE Agarose 凝胶上,电压为 200 伏,使用 20 分钟。
如果您的 qPCR 显示您尚未识别目标序列,请使用新的引用重复整个周期,该引用可以从联机数据库中获取。在这种情况下,减法项目从雄性和雌性成年斑马雀的细菌衬里组织对RNA进行测序开始。最终,确定了935个以前没有列入全基因组注释的体细胞基因。
计算过滤后,定量PCR可能会产生阴性结果,在鸟类组织检测上没有差异。相反,当基因组DNA qPCR显示相对于参考的感兴趣的组织中的统计性检测程度更高时,将确认一个表示真实目标序列识别的阳性结果。在这里,Alpha捕捉基因被验证为细菌系限制,因为它在体细胞组织中耗尽,相对于被检测者的DNA,它存在的水平相当于Actin。
记住在每个计算步骤中使用正确的输入非常重要。您可能需要多次执行循环减法才能获得目标序列或序列。可以对发现的基因进行各种植物遗传学、结构和功能分析。
这些额外的方法提供了对基因的进化和功能作用的洞察。我们在受细菌系限制的松鸟染色体上发现了第一个基因,这拓宽了人们对这个令人惊讶的基因组元素的兴趣。随后的研究显示,在许多含有许多额外基因的松鸟物种中,染色体相似。