该协议概述了研究候选基因的分子进化和表达的生物信息学步骤。在这里,我们提供详尽的说明,使任何具有最少生物信息学经验的人都能通过此协议运行。此管道可应用于任何生物体和任何基因家族。
在做生物信息学时,一个常见的问题是外壳脚本失败。在尝试此协议时,请确保您拥有最新的软件、读取错误文件并仔细检查手册。首先,登录终端或 PuTTY 应用程序窗口上的计算机集群帐户。
在终端上,使用 Wget 下载 SRA 工具包版本 2.8.1,然后完成程序安装。搜索NCBI的SRA加入号码以获取所需的样本,然后在终端窗口中获取RNA序列数据。获取两个 FASTQ 文件以供配对端文件类型。
如果存在,请在线查找参考基因组。要获取参考组件,请在终端窗口中键入 wget,并粘贴链接地址。如果可用,也复制 GTF 文件和蛋白质 FASTA 文件作为参考基因组。
索引基因组,然后映射每个样本的读取和计算表达。将结果文件重命名为具有描述性的东西,并生成所有计数的矩阵。打开互联网浏览器窗口,转到NCBI根银行。
在搜索栏中,键入感兴趣的基因的名称和已测序的密切相关物种的名称。在搜索栏的左侧,选择蛋白质,然后单击"搜索"。通过单击"发送"提取序列,然后选择"文件"。
在格式下,选择 FASTA,然后单击"创建文件"。使用本地终端窗口或文件Zilla将FASTA同名文件移动到计算机集群。接下来,使用 BLAST®在计算机群集上搜索候选基因,从基因组或转录蛋白 FASTA 中建立 BLAST 数据库。
将NCBI的同源基因序列爆炸到感兴趣的物种数据库,然后使用命令查看输出文件。将感兴趣的物种中的独特基因 ID 复制到新的文本文件中。提取候选基因的序列。
要使用互惠爆炸确认基因注释,请转到 BLAST 本地对齐搜索工具,选择 BLASTP,然后粘贴候选序列,选择非冗余蛋白质序列数据库,然后单击 BLAST。打开MEGA,单击"对齐",然后编辑"构建对齐",选择"创建新对齐",然后单击"确定"。选择蛋白质。当对齐窗口打开时,单击"编辑"。
单击"文件"中的插入序列,然后选择具有候选基因和可能同序的蛋白质序列的 FASTA。选择所有序列。找到手臂符号并悬停在它上。
它应该说使用肌肉算法对齐序列。单击手臂符号,然后单击"对齐蛋白"以对齐"编辑参数的序列,或单击"确定"以使用默认参数。该协议适用于海德拉粗俗组织,这是一种淡水无脊椎动物,属于植物性神经质。
对蛋白基因进行了研究,以深入了解动物眼睛和光线检测的演变。H.Vulgaris和其他物种与蛋白相关的基因序列从NCBI基因银行提取到FASTA文件中。蛋白蛋白基因在MEGA中对齐,使得识别海德拉蛋白成为可能,因为海德拉蛋白缺少结合光敏分子所需的保存的氨基酸。
使用来自海德拉粗俗和其他物种的蛋白序列生成了最大可能性树。植物学表明,蛋白基因正在通过神经质的血统特异性复制和H.Vulgaris的串联复制而进化。接下来,在边缘R中进行微分表达分析,以研究蛋白基因的绝对表达。
为了确定一个或多个操作素是在下位或头部中向上调节的,对下体与身体柱、萌芽区、脚和触角进行了对比。结果发现,在下层和身体列之间有1774个成绩单的分化表达。在多次比较中被加强调节的基因被确定,并在 Blast2GO 中进行了功能丰富。
最后,在不同的萌芽阶段和再生的不同时间点,在不同的组织中研究了蛋白基因的绝对表达。对对齐和树的视觉检查将确认候选基因是否属于利益家族。序列上太不同的基因或其他一切之外的一组基因可能是不同基因家族的一部分。
此协议的结果可视为产生假设的结果。这条管道可以突出候选基因,在未来的研究中功能研究。在探索海德拉蛋白表达后,我们现在使用类似的技术来研究不同物种的相关基因,以确定功能的异性和差异。