Method Article
我们目前的基因组序列的分析计算公共网站。它可以检测出各种非随机核苷酸组成的DNA序列模式。这种资源也产生不同层次的复杂的随机序列。
非编码基因组区域,在复杂的真核生物,包括间隔区,内含子,外显子的未翻译的部分,正在深刻地在他们的核苷酸组成的非随机的序列模式的复杂镶嵌组成。这些模式包括中档所谓的不均匀性(MRI)地区 - 序列30-10000的长度是由一个特定的基地或基地相结合,丰富(如(G + T)丰富,富含嘌呤等核苷酸)。与MRI地区是不寻常的(非B型)的DNA结构,往往是参与调控基因表达,重组,以及其他遗传过程(2010年Fedorova和费奥多罗夫)。一个坚强的内固定在核磁共振地区对突变,往往会减少他们的序列不均匀性,同时还支持这些基因组序列的功能和重要性(普拉卡什等人,2009年)的偏见的存在。
在这里,我们展示了一个可以自由使用互联网资源 - 基因组MRI程序包 - (柏克德等2008)基因组序列的计算分析,以便发现和描述在其中的各种磁共振成像模式。此包还允许使用的各种属性和通信水平的自然输入DNA序列的随机序列生成。此资源的主要目标是为了方便广大地区的非编码DNA仍然很少的调查,并等待深入探索和认同的检查。
纸中使用的所有节目已经使用perl编写的,并已经使用PHP创建的所有网页。
1。起点:
打开http://mco321125.meduohio.edu/〜jbechtel / gmri /首页的在线基因组的MRI包。 Web资源,还提供了“帮助(How-to/README)”链接,而对基因组的 MRI和类似的算法所有公布的材料,在“链接到相关的资源”列出的链接方案的说明/解释。
2。输入序列(S)的制备和上传。
创建一个与FASTA格式的序列(S)文件,启动一个GMRI分析会话。这种格式中的每个核苷酸序列之前,应先用一个“>”字符表示一个标识符,同一行的简短描述了这个序列,起跑线。核苷酸序列GMRI分析还允许字符R,Y,N,X等Hwever,非A,T,C,G字符不会被处理程序,将被跳过。重复的元素,其中有被“蒙面”(“N”代替)的序列可以作为输入。请注意,序列字符大小写不敏感的。
注:今后,输入序列简称为“userfile的”。
3。得到一个输入序列(可选)寡核苷酸的频率分布。
为了得到整个输入序列的寡核苷酸频率分布点击“SRI的分析仪”选项卡(上排) 。 SRI的缩写代表的短距离的不均匀性。此时,用户可以指定最高的寡核苷酸长度(从2到9个核苷酸,默认为6 NTS)的频率将被计算。这个选择是通过单击所需的选项内“ 最大的低聚物的大小”列表框。然后按“ 分析文件 ”按钮,启动计算。一个输入序列组成的粗糙表示将立即在本网页中显示为一个短表和“userfile.comp.tbl”下载。此表只有最和最丰富的寡核苷酸在输入序列。
所有可能的寡核苷酸的整个频率表生成名为“userfile.comp”的文件,它可以通过“下载的组成文件“链接获得。
注:SRI的分析仪计数的所有重叠的寡核苷酸的整套。
4。生成相同的输入序列(可选)寡核苷酸组成的随机序列。
(这个任务需要完成该协议的第3步)。
5。中档不均匀性(MRI)的输入和随机序列分析。
6。在基因组MRI包(可选)的附加 程序。
基因组MRI资源也有非常具体的随机序列生成的两个高级选项。它们可通过“ 核磁共振发生器 ”和“ 的CDS发生器 ”第一行中的标签。
7。代表性的成果
该协议允许用户研究核苷酸序列组成的不均匀。更重要的是,它也支持各种随机序列寡核苷酸逼近输入序列组成的一代。通常,复杂的真核生物的基因组序列是不均质的构成,而是代表了丰富的特定核苷酸序列片段的复杂镶嵌(例如,丰富的嘌呤,(G + T),丰富的,(A + T)丰富,等)。中档规模(30-1000 BP),这些模式是由蓝色峰值和较低的红色尖峰内容贫乏的分类(参见图1和2)显示所选内容丰富段的核磁共振分析仪的图形输出显示。通常情况下,在任何一个自然顺序(图1)内容丰富,内容贫乏的地区是时间顺序高于地区相应的随机序列的相同类型(图2)具有相同的寡核苷酸的数量组成。这些序列片段与中档核苷酸组成的不均匀性,可能是用户感兴趣的。他们是从基因组作进一步调查 MRI输出文件。
图1的核磁共振分析仪从步骤5.7图形输出的一个例子。上一个44人的内含子的样本已取得的结果。蓝色条代表沿着这些内含子富含GC的区域位置。红条代表的GC -差(或)MRI检查AT丰富的地区。 Y轴为给定的内容类型包含的上限和下限。
图2。 核磁共振分析仪输出的随机序列“userfile.rand1_4”。
该图形化CAL代表性的MRI使用SRI的发电机程序在一个随机生成的的序列。
图3:从核磁共振分析仪的文本输出文件的开头的一个例子。
全部内容丰富,内容贫乏的程序中检测到的序列是在过去的(第四位)列。在窗户的数量来衡量,它们的相对位置,显示在第一列。第二和第三列是内容丰富,内容贫乏的地区,分别指标。
不均匀中档规模的核苷酸组成(30-1000核苷酸)的地区是在复杂的真核生物的基因组overabundant的,可以找到任何地方(间隔区,内含子,外显子的非翻译区,重复元素)。这些地区经常与异常DNA的构象。例如,purine-/pyrimidine-rich序列往往形成DNA triplexes(H - DNA);交替嘌呤/嘧啶碱基序列与Z - DNA的构象相关的(G + C)丰富的地区表现出的结构异常乙DNA和可容易骨干乳沟;(A + T)丰富的地区可能会形成一个不寻常的的结构 - 一个DNA平仓元素等(2010年费奥多罗夫&Fedorova审查)。一些这些中档的模式(如(G + T)丰富的地区)几乎没有调查,仍有待深入探索和认同。我们的基因组的 MRI Web资源的主要目的是帮助用户为他们进一步的实验分析,并探索其可能的功能磁共振成像地区的鉴定。 MRI的地区的知识可以被纳入,并提高新一代基因预测程序(谢泼德2010年)和推进我们了解基因组的功能和属性。
我们感谢塞缪尔谢泼德,彼得Bazeley,约翰大卫贝尔基因MRI网页管理。这项工作是由美国国家科学基金会职业奖“,内含子细胞的作用研究”[授予MCB - 0643542]。
请求许可使用此 JoVE 文章的文本或图形
请求许可This article has been published
Video Coming Soon
版权所属 © 2025 MyJoVE 公司版权所有,本公司不涉及任何医疗业务和医疗服务。