このコンテンツを視聴するには、JoVE 購読が必要です。 サインイン又は無料トライアルを申し込む。

この記事について

  • 要約
  • 要約
  • 概要
  • プロトコル
  • 結果
  • ディスカッション
  • 開示事項
  • 謝辞
  • 資料
  • 参考文献
  • 転載および許可

要約

ここで説明するプロトコルは、ユーザーフレンドリーなUCSCゲノムブラウザ上のPhyloCSFを使用して、マイクロタンパク質コードの可能性について関心のあるゲノム領域を分析する方法に関する詳細な手順を提供します。さらに、同定されたマイクロタンパク質の配列特性をさらに調査し、推定機能に関する洞察を得るために、いくつかのツールとリソースが推奨されます。

要約

次世代シーケンシング(NGS)は、ゲノミクスの分野を前進させ、多数の動物種およびモデル生物の全ゲノム配列を生み出しました。しかし、この豊富な配列情報にもかかわらず、包括的な遺伝子アノテーションの取り組みは、特に小さなタンパク質では困難であることが証明されています。特に、従来のタンパク質アノテーション法は、ゲノム全体にわたって指数関数的に多い数の偽の非コードsORFを除外するために、長さが300ヌクレオチド未満の短いオープンリーディングフレーム(sORF)によってコードされる推定タンパク質を意図的に除外するように設計されていた。その結果、マイクロタンパク質(<100アミノ酸長)と呼ばれる何百もの機能的な小さなタンパク質が、誤ってノンコーディングRNAとして分類されたり、完全に見過ごされてきました。

ここでは、無料で公開されているバイオインフォマティクスツールを活用して、進化的保存に基づいてゲノム領域にマイクロタンパク質コードの可能性を照会するための詳細なプロトコルを提供します。具体的には、ユーザーフレンドリーなカリフォルニア大学サンタクルーズ校(UCSC)ゲノムブラウザの系統コドン置換頻度(PhyloCSF)を使用して配列保存とコーディングの可能性を調べる方法について、段階的な手順を提供します。さらに、同定されたマイクロタンパク質配列の複数種のアラインメントを効率的に生成してアミノ酸配列の保存を視覚化する手順を詳述し、予測されたドメイン構造を含むマイクロタンパク質特性を分析するためのリソースを推奨します。これらの強力なツールは、非正規ゲノム領域における推定マイクロタンパク質コード配列の同定に役立てたり、目的の非コード転写産物中に翻訳可能性を有する保存されたコード配列の存在を排除するために使用できます。

概要

ゲノム中のコード要素の完全なセットの同定は、ヒトゲノムプロジェクトの開始以来、主要な目標であり、生物学的システムおよび遺伝ベースの疾患の病因の理解に向けた中心的な目的であり続けている1,2,3,4。NGS技術の進歩により、脊椎動物、無脊椎動物、酵母、植物など、広範な数の生物の全ゲノム配列が生産されました5。さらに、ハイスループット転写シーケンシング法は、細胞トランスクリプトームの複雑さをさらに明らかにし、タンパク質コード機能と非コード機能の両方を有する何千もの新規RNA分子を同定した6,7。この膨大な量の配列情報を解読することは進行中のプロセスであり、包括的な遺伝子アノテーションの取り組みには課題が残っています8

リボソームプロファイリング9,10およびポリリボソームシーケンシング11を含む翻訳プロファイリング方法の最近の開発は、何百もの非正....

プロトコル

以下に概説するプロトコルは、UCSCゲノムブラウザ(Mudgeらによって生成された)上のPhyloCSFブラウザトラックをロードしてナビゲートする手順を詳述している。UCSCゲノムブラウザに関する一般的な質問については、広範なゲノムブラウザユーザーズガイドがここにあります: https://genome.ucsc.edu/goldenPath/help/hgTracksHelp.html.

1. PhyloCSF トラックハブの UCSC ゲノムブラウザへのロード

  1. インターネットブラウザウィンドウを開き、UCSCゲノムブラウザ(https://genome.ucsc.edu/)に移動します。
  2. [ ツール ] 見出しで、[ ハブの追跡] オプションを選択します。
    メモ: [ハブの追跡 ] オプションは、[ マイ データ ] タブの下にもあります。
  3. [パブリック ハブ....

結果

ここでは、検証済みのマイクロタンパク質ミトレグリン(Mtln)を例として使用して、保存されたsORFがUCSCゲノムブラウザで簡単に視覚化および分析できる正のPhyloCSFスコアを生成する方法を実証します。ミトレグリンは、以前は非コードRNAとして注釈が付けられていた(旧ヒト遺伝子ID LINC00116およびマウス遺伝子ID 1500011K16Rik)。 比較ゲノミクスおよび配列保存解析法は、その最初の?.......

ディスカッション

ここで紹介するプロトコルは、ユーザーフレンドリーなUCSCゲノムブラウザ48,49,50,51上のPhyloCSFを使用して、マイクロタンパク質コードの可能性について関心のあるゲノム領域を問い合わせる方法に関する詳細な指示を提供します。上記で詳述したように、PhyloCSFは、系統発生モデルとコドン置換頻.......

開示事項

著者らは、競合する金銭的利益はないと宣言している。

謝辞

この研究は、国立衛生研究所(HL-141630およびHL-160569)とシンシナティ小児研究財団(受託者賞)からの助成金によって支援されました。

....

資料

NameCompanyCatalog NumberComments
WebsiteWebsite AddressRequirements
Clustal Omega Multiple Sequence Alignment Toolhttps://www.ebi.ac.uk/Tools/msa/clustalo/Web browserMultiple sequence alignment program for the efficient alignment of FASTA sequences (i.e. for cross-species comparison of identified microproteins)
COXPRESSdbhttps://coxpresdb.jpWeb browserProvides co-regulated gene relationships to estimate gene functions
EMBL-EBI Bioinformatics Tools FAQshttps://www.ebi.ac.uk/seqdb/confluence/display/JDSAT/Bioinformatics+Tools+FAQWeb browserFrequently Asked Questions (FAQs) for EMBL-EBI tools. Includes the color coding key for protein sequence alignments
European Bioinformatics Institute (EMBL-EBI),
Tools and Data Resources
https://www.ebi.ac.uk/services/allWeb browserComprehensive list of freely available websites, tools and data resources
Expasy - Swiss Bioinformatics Resource Portalhttps://www.expasy.orgWeb browserSuite of bioinformatic tools and resources for protein sequence analysis that is maintained by the Swiss Institute of Bioinformatics (SIB)
National Center for Biotechnology Information (NCBI)
Conserved Domain Search
https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgiWeb browserSearch tool to identify conserved domains within protein or coding nucleotide sequences
Pfam 35http://pfam.xfam.orgWeb browserProtein family (Pfam) database, provides alignments and classification of protein families and domains
PhyloCSF Track Hub Description https://genome.ucsc.edu/cgi-bin/hgTrackUi?hgsid=1267045267_TEc99h2oW5Q
edaCd4ir8aZ65ryaD&db=mm10
&c=chr2&g=hub_109801_
PhyloCSF_smooth
Web browserDetailed description of the Smoothed PhyloCSF tracks and PhyloCSF Track Hub
   
   
   
   
   
SignalP 6.0https://services.healthtech.dtu.dk/service.php?SignalP-6.0Web browserPredicts the presence of signal peptides and the location of their cleavage sites
TMHMM - 2.0https://services.healthtech.dtu.dk/service.php?TMHMM-2.0Web browserPrediction of transmembrane helices in proteins
UCSC Genome Browser BLAT Searchhttps://genome.ucsc.edu/cgi-bin/hgBlatWeb browserTool used to find genomic regions using DNA or protein sequence information
UCSC Genome Browser Gatewayhttps://genome.ucsc.edu/cgi-bin/hgGatewayWeb browserDirect link to the UCSC Genome Browser Gateway
UCSC Genome Browser Homehttps://genome.ucsc.edu/Web browserHome website for the UCSC Genome Browser
UCSC Genome Browser Track Data Hubshttps://genome.ucsc.edu/cgi-bin/hgHubConnect#publicHubsWeb browserDirect link to Track Data Hubs/Public Hubs database to search for and load the PhyloCSF Tracks
UCSC Genome Browser User Guidehttps://genome.ucsc.edu/goldenPath/help/hgTracksHelp.htmlWeb browserComprehensive user guide detailing how to navigate the UCSC Genome Browser
WoLF PSORThttps://wolfpsort.hgc.jpWeb browserProtein subcellular localization prediction tool

参考文献

  1. Collins, F. S., Morgan, M., Patrinos, A. The human genome project: lessons from large-scale biology. Science. 300 (5617), 286-290 (2003).
  2. Lander, E. S., et al. Initial sequencing and analysis of the human genome.

転載および許可

このJoVE論文のテキスト又は図を再利用するための許可を申請します

許可を申請

さらに記事を探す

185

This article has been published

Video Coming Soon

JoVE Logo

個人情報保護方針

利用規約

一般データ保護規則

研究

教育

JoVEについて

Copyright © 2023 MyJoVE Corporation. All rights reserved