ここで説明するプロトコルは、ユーザーフレンドリーなUCSCゲノムブラウザ上のphyloCSFを使用して、タンパク質コードの可能性について関心のあるゲノム領域を分析するための詳細な手順を提供します。PhloCSFは、現在非コードとして注釈が付けられているゲノム領域において、マイクロタンパク質コードの可能性を有する保存された短いオープンリーディングフレームを効果的に同定することができる。ここで説明する方法は簡単に使用でき、バイオイフォーマティクスまたは比較ゲノミクスの事前のトレーニングや専門知識がなくても、あらゆるバックグラウンドの研究者が実施できます。
まず、インターネットブラウザウィンドウを開き、カリフォルニア大学サンタクルーズ校またはUCSCゲノムブラウザに移動します。ツールの見出しの下で、[ハブの追跡] オプションを選択します。[パブリック ハブ] タブで、検索語ボックスに phyloCSF と入力します。
次に、[パブリックハブの検索]ボタンをクリックします。ハブ名 phyloCSF の接続ボタンをクリックして、phyloCSF に接続します。接続をクリックした後、UCSCゲノムブラウザゲートウェイページにリダイレクトするのを待ちます。
別の種を照会するには、参照の下で目的の種を選択するか、適切なアイコンをクリックして種の見出しを選択するか、種共通名またはアセンブリIDを入力するテキストボックスに種を入力します。ドロップダウンメニューを使用して、定義された位置見出しの下で検索するアセンブリを選択し、位置または検索語ボックスに位置遺伝子記号または検索用語を入力し、[移動]をクリックしてナビゲートしますゲノムブラウザ上の目的の遺伝子に。検索の結果、複数の一致が見つかった場合は、関心のある位置の選択を必要とするページにリダイレクトされるのを待ってから、適切な目的の遺伝子をクリックします。UCSCゲノムブラウザに移動した後、芽球様アライメントツールを選択するか、当社のツール見出しの下でブラットして、特定のDNAまたはタンパク質配列を照会します。
または、ツールタブの上にカーソルを置き、blat オプションを選択するか、指定されたリンクをたどります。ドロップダウンメニューを使用して、目的の種、ゲノム、およびアセンブリを選択します。次に、クエリタイプを定義し、目的のシーケンスを blat 検索ゲノムテキストボックスに貼り付けて、[送信] をクリックします。
次に、アクション見出しの下にあるブラウザリンクをクリックして、関心のあるゲノム領域に移動します。関心のあるゲノム領域を視覚的にスキャンして、フィロCSF領域を正にスコアリングします。ズーム機能を使用して、関心領域を拡大して配列特性を調べ、開始コドンと停止コドンを検索します。
手動でズームインするには、Shift キーを押しながら、関心領域に沿ってドラッグしながらマウス ボタンをクリックしたままにします。または、ページ上部の [ズームイン] ボタンと [ズーム アウト] ボタンを使用して移動します。ヌクレオチドまたは塩基配列が表示されるまでズームインします。
正にスコアリングされた系統CSF領域の始点と終点付近の核潮汐配列を目視でスキャンし、懲罰的な開始コドンと停止コドンを同定する。ページ上部のビュー見出しの上にマウスカーソルを置き、[他のゲノム変換]オプションをクリックしてから、新しいゲノム見出しの下のドロップダウンメニューを使用して目的のゲノムを定義します。新しいアセンブリ見出しの下で目的のゲノムアセンブリを選択し、「送信」ボタンをクリックします。
ブラウザが新しいアセンブリ内の類似性を持つ領域のリストを返すと。染色体位置のリンクをクリックして、相同な関心領域に移動します。前述のナビゲーション戦略に従って、シーケンスを分析します。
遺伝子説明ページに移動するには、UCSCゲノムブラウザのgenコードトラックで目的の遺伝子をクリックします。シーケンスとツールとデータベースへのリンクの見出しの下で、他の種をより速く読み取る表のリンクをクリックします。関心のある種に関連付けられているボックスをクリックして選択します。
次に、[送信]をクリックします。ページの下部に表示されるシーケンスをコピーして、より高速な形式でワープロ文書に貼り付けます。次に、2番目のブラウザウィンドウを開き、欧州バイオインフォマティクス研究所のウェブサイトにあるclustal ω多重配列アライメントツールに移動します。
クリップボード上のシーケンスファイルを、サポートされている任意の形式のシーケンスを読み取る手順 1 のボックスに貼り付けます。ページの一番下までスクロールし、[送信]をクリックします。各アミノ酸の保存の程度を示す記号の整列結果を以下に観察する。
アミノ酸の特性と色を表示するには、シーケンスのすぐ上にある[色の表示]リンクをクリックして、その特性に従ってアミノ酸に色を付けます。次に、シーケンスの配置をコピーしてワープロまたはスライドショープログラムに貼り付けて、図またはイラストレーションファイルを生成します。clustal omega の結果ページからの他の出力を表示するには、タブガイドツリーまたは系統発生遺伝子ツリーをクリックします。
最後に、結果ビューアのタブをクリックして、jalviewを使用してシーケンス情報を表示したり、mviewや単純な系統学への直接リンクにアクセスしたりするためのオプションを表示します。ミトレグリン遺伝子の代表的な系統CSF解析は、検証されたマイクロタンパク質に対応する高い配列保存性の領域を示す。完全なミトレグリンコード配列はエクソン1内に含まれ、フィロCSFから1トラックを引いた上で非常に高いスコアを付けます。
保存された開始コドンは、フィロCSFから1トラックを引いた正のスコアリング領域の先頭で観察することができる。ミトレグリンの第一エクソンにおける正のスコアリング領域は、開始コドンの真上で始まり、終止コドンで終わる。8つの異なる種に対するマイクロタンパク質ミトレグリンの多重配列アラインメントがここに示されている。
長いノンコーディングRNAの熱風の解析では、6つのトラックすべてにわたって遺伝子全体にわたって負のスコアを示し、配列保存の欠如を示し、熱風が非コードRNAとして正しく注釈されていることを支持した。マウス1、8、1、0、0、5、8、I 24 rike遺伝子のPhyloCSF分析は、保存されたオープンリーディングフレームが3つのエクソンにまたがり、正のphyloCSFスコアがエクソン1のプラス2トラックからエクソン2のプラス3トラックにジャンプし、その後エクソン3のプラス2トラックに戻ることを示した。ミート1つの遺伝子座のPhyloCSF解析は、単一のRNA分子内の複数の別個のコードオープンリーディングフレームを同定するためにも効果的に使用された。
正の系統CSFスコアはマイクロタンパク質コード能力を強く示唆するものの、この一連の証拠は単独では成り立たず、実験的に検証されなければならないことに注意することが重要です。マイクロタンパク質の期間が同定されると、アミノ酸配列は、その機能への洞察を提供するために、保存されたドメインまたは配列特性について分析することができる。PhyloCSFは、以前は非コードであると考えられていたゲノム領域における新規マイクロタンパク質を同定するために効果的に使用されており、将来のマイクロタンパク質同定研究において有用なツールであり続けるであろう。