Method Article
我々は、ゲノム配列の解析のために公共の計算のウェブサイトを提示する。それは様々な非ランダムな塩基組成とDNA配列のパターンを検出します。このリソースは、また複雑さの多様なレベルでランダム化されたシーケンスを生成します。
遺伝子間の領域、イントロン、そしてエキソンの未翻訳セグメントを含む複雑な真核生物、、の非コードゲノム領域は、それらのヌクレオチド組成に深く非ランダムであり、シーケンスパターンの複雑なモザイクで構成されています。配列(例えば(G + T)が豊富な、プリン体を多く含む、などの塩基の特定の塩基またはその組み合わせによって豊かにされている長さは30から10000ヌクレオチド - これらのパターンは、いわゆるミッドレンジの不均質性(MRI)の領域が含まれています)。 MRIの領域は、多くの場合、遺伝子発現、組換え、および他の遺伝的プロセス(フェドロワ&フェド2010)の調節に関与している異常な(非B型)DNAの構造に関連付けられています。それらの配列の不均一性を低下させる傾向の変異に対するMRIの領域内で強力な固定バイアスの存在は、さらに、これらのゲノム配列(Prakashさんら 2009)の機能性と重要性をサポートしています。
ゲノムMRIプログラムパッケージ- -それらの内の様々なMRIのパターン(。ベクテルら 2008)を見つけると特徴づけるために、ゲノム配列のコンピューター解析のために設計されたここでは、自由に利用できるインターネットリソースを示しています。また、このパッケージには、ナチュラルインプットのDNA配列へのさまざまなプロパティとの対応のレベルでランダム化されたシーケンスを生成できます。このリソースの主な目標は、まだほとんど調査されないし、徹底した調査との認識を待っている非コードDNAの広大な地域の調査を容易にするためです。
紙のすべての使用されるプログラムはperlを使って書かれており、すべてのWebページがPHPを使用して作成されている。
1。出発点:
http://mco321125.meduohio.edu/〜jbechtel / gmri /オンラインゲノムMRIパッケージのホームページを開きます。 Webリソースは、" ヘルプ(How-to/README)"リンク、 ゲノムMRIと同様のアルゴリズム上のすべての出版物が" 関連するリソースへのリンク "にリストされている間のリンクでプログラムの指示/説明を提供します。
2。入力シーケンスの準備とアップロード(複数可)。
GMRI分析セッションを開始するにはFASTA形式の配列(複数)を持つファイルを作成します。この形式の各塩基配列は、このシーケンスの簡単な説明によって同じ行に続けて識別子を表す">"文字で始まる一行を前にしてください。 GMRI分析のためのヌクレオチド配列はまた、R、Y、N、X、などHwever、非A、T、Cのような文字を許可する、Gの文字は、プログラムによって処理されず、スキップされます。反復の要素が("N"ので置き換え)"マスク"されているシーケンスを入力として使用することができます。シーケンスの文字は、大文字小文字を区別しないことに注意してください。
注記:これ以降の入力シーケンスが"としてuserfile"と呼ばれている。
3。入力シーケンス(オプション)のオリゴヌクレオチド頻度分布を取得します。
入力シーケンスのセット全体のためのオリゴヌクレオチド頻度の分布を得るために、"SRIアナライザ "タブ(一番上の行)をクリックしてください。頭字語SRIは、短距離の不均一性を表しています。この際、ユーザは周波数が計算されるためのオリゴヌクレオチドの最高の長さ(2まで〜9個、デフォルトは6 NTS)を指定することができます。この選択は、" 最大オリゴマーのサイズ "リストボックス内で目的のオプションをクリックすることによって行われます。その後、計算を開始する" ファイルを解析 "ボタンを押してください。入力シーケンスの構成の大まかな表現では、すぐにこのウェブページの中央に短い表として表示され、"userfile.comp.tbl"としてダウンロード可能になります。この表は、入力シーケンス内でだけ最も、少なくとも豊富なオリゴヌクレオチドを表しています。
すべての可能なオリゴヌクレオチドのための全周波数の表は、" ダウンロード構成ファイル "のリンクを介して得られる"userfile.comp"という名前のファイルとして生成されます。
注記:SRIアナライザは、すべての重複オリゴヌクレオチドのセット全体をカウントする。
4。入力シーケンス(オプション)と同じオリゴヌクレオチド組成を持つ乱数列を生成します。
(プロトコールのステップ3の完了は、このタスクに必要とされる)。
5。入力とランダム配列のミッドレンジ不均一(MRI)の分析。
6。 ゲノムMRIパッケージ(オプション)の中で追加のプログラム。
ゲノムMRIリソースも非常に特定のランダムシーケンスを生成するための2つの高度なオプションがあります。彼らは"MRIジェネレータ "と一番上の行の"CDSジェネレータ "タブから利用できます。
7。代表的な結果
このプロトコルは、ユーザーが塩基配列の組成不均一性を研究することができます。重要なのは、それはまた、入力シーケンスのように近似するオリゴヌクレオチド組成の無作為化シーケンスのさまざまな生成をサポートしています。 (例えば、プリン体を多く含む、(G + T通常、複雑な真核生物のゲノム配列は、組成物中に均質ではなく、むしろ特定のヌクレオチドによって豊かに配列セグメントの複雑なモザイクを表す)が豊富な、(+ T)が豊富な、など)。ミッドレンジのスケール(30から1000塩基対)で、これらのパターンには、上部の青色のスパイクと低赤いスパイクなどのコンテンツに乏しいのセグメント(図1および図2を参照)として、コンテンツが豊富なセグメントを選択されていますMRIアナライザのグラフィカルな出力によって視覚化されます。通常、天然の配列(図1)内の任意のコンテンツリッチとコンテンツの乏しい領域の数は同じオリゴヌクレオチドを有する対応する無作為化シーケンスの地域の同じタイプ(図2)の数よりも倍程度である組成物。ヌクレオチド組成のミッドレンジの不均一性を持つこれらのシーケンスのセグメントは、ユーザーが関心を持つ可能性があります。彼らは、さらなる調査のためのゲノムMRIの出力ファイルから入手できます。
図1、ステップ5.7からMRIアナライザのグラフィカルな出力の例。結果は44のヒトイントロンのサンプルで得られている。青いバーは、これらのイントロンに沿ってGC -リッチ領域の位置を表します。赤いバーは、GC -乏しい(またはAT -リッチ)MRI領域を表します。 y軸は、特定のコンテンツタイプの上限と下限のしきい値が含まれています。
ランダムシーケンス"userfile.rand1_4"については、 図2。MRI アナライザの出力。
グラフィカSRIジェネレータのプログラムを使用してランダムに生成されたシーケンス内のMRIのCALを表現。
図3。MRI アナライザからテキスト出力ファイルの最初の例。
プログラムによって検出されたすべてのコンテンツリッチとコンテンツの乏しいシーケンスは、最後(4番目)の列に表示されます。窓の数で測定されたそれらの相対的な位置は、、最初の列に表示されます。 2番目と3番目の列は、それぞれコンテンツリッチコンテンツの乏しい地域、の指標です。
ミッドレンジのスケールで不均一なヌクレオチド組成(30〜1000ヌクレオチド)を持つ領域が複雑な真核生物のゲノムに有り余るものであり、(遺伝子間領域、イントロン、エクソンの翻訳領域、反復要素)の任意の場所を見つけることができます。これらの領域は頻繁に異常なDNAのコンフォメーションに関連付けられています。例えば、purine-/pyrimidine-richシーケンスは、DNAのtriplexes(H - DNA)を形成する傾向があり、交互にプリン/ピリミジン塩基とシーケンスは、Z - DNAのコンフォメーションに関連付けられている、(G + C)が豊富な地域での構造異常を示すB -等(フェド&フェドロワ2010年レビュー)、 - 、DNAとバックボーンの切断を起こしやすい可能性がある要素をほどくDNA(A + T)豊富な地域では珍しい構造を形成するかもしれない。これらのミッドレンジパターン(例えば、(G + T)が豊富な地域)のいくつかはほとんど調べていないと、まだ徹底的な調査と認識をお待ちしていますされています。私たちのゲノムMRIのWebリソースの主な目的は、彼らのさらなる実験的解析とそれらの可能な機能の探査のためのこれらのMRIの領域の識別にユーザを支援することです。 MRIの領域の知識が組み込まれ、遺伝子予測プログラムの新世代(シェパード2010)改善し、ゲノム機能と特性の理解を進めることができる。
我々は、 ゲノムMRI Webページの管理のためのサミュエルシェパード、ピーターBazeley、そしてジョンDavidベルに感謝しています。この作品は、"イントロン細胞の役割の解明"[助成金番号MCB - 0643542]国立科学財団のキャリア賞によってサポートされていました。
このJoVE論文のテキスト又は図を再利用するための許可を申請します
許可を申請This article has been published
Video Coming Soon
Copyright © 2023 MyJoVE Corporation. All rights reserved