JoVE Logo

サインイン

このコンテンツを視聴するには、JoVE 購読が必要です。 サインイン又は無料トライアルを申し込む。

この記事について

  • 要約
  • 要約
  • 概要
  • プロトコル
  • 結果
  • ディスカッション
  • 資料
  • 参考文献
  • 転載および許可

要約

ここでは、1)既知および新規のmiRNAをより正確に同定でき、2)完全に自動化され、自由に利用できる新しい完全に自動化されたmiRNAパイプラインmirMachineを紹介します。ユーザーは、短い送信スクリプトを実行して、完全に自動化された mirMachine パイプラインを実行できるようになりました。

要約

さまざまな種類のノンコーディングRNAの中で、マイクロRNA(miRNA)は間違いなく過去10年間で脚光を浴びてきました。遺伝子発現の転写後調節因子として、miRNAは、干ばつや病気などの発生と生物的ストレスへの応答の両方を含む、さまざまな細胞経路で重要な役割を果たします。高品質のリファレンスゲノム配列を持つことで、miRNA配列が高度に保存されているいくつかの植物種におけるmiRNAの同定とアノテーションが可能になりました。計算miRNAの同定とアノテーションのプロセスはほとんどエラーを起こしやすいプロセスであるため、相同性に基づく予測は予測精度を高めます。私たちは、過去10年間でmiRNAアノテーションパイプラインSUmirを開発および改良し、それ以来、いくつかの植物ゲノムに使用されてきました。

この研究では、(i)二次構造予測に追加のフィルタリングステップを追加し、(ii)完全に自動化し、(iii)以前のパイプラインを使用して、相同性に基づく既知のmiRNAまたは低分子RNAシーケンシングリードに基づく新規miRNAのいずれかを予測するための新しいオプションを導入することにより、完全に自動化された新しいmiRNAパイプラインmirMachine(miRNA Machine)を提示します。新しいmiRNAパイプラインmirMachineは、シロイヌナズナ情報リソースTAIR10、 シロイヌナ ズナゲノムのリリース、および国際小麦ゲノムシーケンスコンソーシアム(IWGSC)小麦リファレンスゲノムv2を使用してテストされました。

概要

次世代シーケンシング技術の進歩により、RNAの構造と調節要素の理解が広がり、機能的に重要なノンコーディングRNA(ncRNA)が明らかになりました。さまざまな種類のncRNAの中で、マイクロRNA(miRNA)は、植物において19〜24ヌクレオチドの長さの低分子RNAの基本的な調節クラスを構成します1,2。線虫Caenorhabditis elegans3で最初のmiRNAが発見されて以来、miRNAの存在と機能は動植物ゲノムでも広く研究されてきました4,5,6。miRNAは、切断または翻訳抑制のためにmRNAを標的とすることによって機能します7。証拠の蓄積は、miRNAが成長と発生8、自己生生物発生9、およびいくつかの生物的および非生物的ストレス応答10を含む植物の幅広い生物学的プロセスに関与していることも示しています。

植物では、miRNAは最初にpri-miRNA11と呼ばれる長い一次転写物からプロセシングされます。核内のRNAポリメラーゼIIによって生成されたこれらのpri-miRNAは、不完全なフォールドバック構造を形成する長い転写物である12。pri-miRNAは後に切断プロセスを経て、pre-miRNA11と呼ばれるmiRNAの内因性一本鎖(ss)ヘアピン前駆体を生成します。プレmiRNAはヘアピン様構造を形成し、一本鎖が二本鎖構造に折りたたまれてmiRNA二重鎖(miRNA/miRNA*)を切除します13。ダイサー様タンパク質は、miRNA/miRNA*二重鎖の両鎖を切断し、2ヌクレオチド3'-オーバーハング14,15を残します。miRNA二重鎖は核内でメチル化され、miRNAの3'末端を分解およびウリジル化活性から保護する16,17。ヘリカーゼは、輸出後にメチル化miRNA二重鎖を巻き戻し、成熟miRNAをサイトゾル18中のRNA誘導サイレンシング複合体(RISC)に曝露する。二重鎖の一方の鎖はRISCに取り込まれた成熟miRNAですが、もう一方の鎖であるmiRNA*は分解されます。miRNA-RISC複合体は標的配列に結合し、完全な相補性の場合はmRNA分解、部分相補性の場合は翻訳抑制のいずれかを引き起こします13

発現および生合成の特徴に基づいて、miRNAアノテーションのためのガイドラインが記載されている1519。定義されたガイドラインを使用して、LucasとBudakは、植物9で相同性に基づくインシリコmiRNA同定を実行するためのSUmirパイプラインを開発しました。SUmir パイプラインは、SUmirFind と SUmirFold の 2 つのスクリプトで構成されていました。SUmirFindは、国立バイオテクノロジー情報センター(NCBI)の基本ローカルアライメント検索ツール(BLAST)スクリーニングを通じて既知のmiRNAデータセットに対して類似性検索を実行し、2つ以下のミスマッチのみのヒットを含め、より短いヒットへのバイアスを回避します(blastn-short-unapped-penalty-1-reward1)。SUmirFoldは、UNAfold21を用いて、BLAST20の結果から推定miRNA配列の二次構造を評価する。スミルフォールドは、ヘアピン構造の特徴を同定することにより、miRNAと小さな干渉RNAを区別します。さらに、パラメータ、最小倍率エネルギー指数>0.67、GC含量24〜71%によって、miRNAをtRNAやrRNAなどの他のssRNAと区別します。このパイプラインは、(i)感度を高める、(ii)アノテーション精度を高める、および(iii)予測されたmiRNA遺伝子のゲノム分布を提供するための2つのステップを追加することによって最近更新されました22。植物のmiRNA配列23の保存性が高いことを考えると、このパイプラインはもともと相同性に基づくmiRNA予測のために設計されました。しかし、新規miRNAは、近縁種間のmiRNAの配列保存に大きく依存していたため、このバイオインフォマティクス解析では正確に同定できませんでした。

この論文では、1)既知および新規のmiRNAをより正確に同定できる(たとえば、パイプラインは現在、sRNA-seqベースの新規miRNA予測と相同性ベースのmiRNA同定を使用する)、2)完全に自動化され、自由に利用できる、完全に自動化された新しいmiRNAパイプラインmirMachineを紹介します。出力には、予測されたmiRNAのゲノム分布も含まれています。mirMachineは、コムギおよび シロイヌナ ズナのゲノムにおける相同性ベースの予測とsRNA-seqベースの予測の両方についてテストされました。当初はフリーソフトウェアとしてリリースされましたが、UNAfoldは過去10年間で商用ソフトウェアになりました。今回のバージョンアップに伴い、二次構造予測ツールをUNAfoldからRNAfoldに切り替え、mirMachineを自由に利用できるようになりました。ユーザーは、短い送信スクリプトを実行して、完全に自動化された mirMachine パイプラインを実行できるようになりました (例は https://github.com/hbusra/mirMachine.git で提供されています)。

プロトコル

1.ソフトウェアの依存関係とインストール

  1. ホームサイトから、またはcondaを使用してソフトウェアの依存関係をインストールします。
    1. Perl がまだインストールされていない場合は、ホーム サイト (https://www.perl.org/get.html) からダウンロードしてインストールします。
      注: 表された結果は、Perl v5.32.0 を使用して予測されました。
    2. アライメントプログラムであるBlast+をホームサイト(https://www.ncbi.nlm.nih.gov/books/NBK279671/)から実行可能ファイルおよびソースコードとしてダウンロードします。
      注:表された結果は、BLAST 2.6.0+を使用して予測されました。
    3. https://www.tbi.univie.ac.at/RNA/ からRNAfoldのプリコンパイル済みパッケージをインストールします。
    4. または、次のコンダを使用してこれらのソフトウェアをインストールします:i)コンダインストール-cバイオコンダブラスト;ii)コンダ インストール-cビオコンダウィーン

2. mirMachine のセットアップとテスト

  1. 最新バージョンの mirMachine スクリプトと mirMachine 送信スクリプトを GitHub、https://github.com/hbusra/mirMachine.git からダウンロードし、スクリプトのパスを PATH に設定します。
  2. GitHub で提供されているテスト データを使用して、mirMachine とそのすべての依存関係が正しくダウンロードされていることを確認します。
  3. 以下に示すテストデータでmirMachineを実行します。
    bash mirMachine_submit.sh -f iwgsc_v2_chr5A.fasta -i mature_high_conf_v22_1.fa.filtered.fasta -n 10
    注:テストデータには小麦ゲノムの染色体が1つしか含まれていないため、 -n オプションを10に設定します。デフォルトでは、 -n オプションは 20 に設定されています。
  4. 予測された成熟miRNA、それらの予測された前駆体、および染色体上のそれらの位置の ヘアピン.tbl.out.tbl 出力ファイルを制御します。
  5. ログ ファイルでプログラムの出力と警告を確認します。

3. 相同性に基づくmiRNA同定

  1. 以下に示すbashスクリプトを使用してmirMachineを実行します。
    bash mirMachine_submit.sh -f $genome_file -i $input_file -m $mismatches -n $number_of_hits
  2. 予測されたmiRNAを確認してください。予測された miRNA の $input_file.results.tbl.hairpins.tbl.out.tbl という名前の出力ファイルを見つけます。pre-miRNA FASTA配列の $input_file.results.tbl.hairpins.fsa という名前の出力ファイルを見つけます。ヘアピン ログ ファイルの $input_file.results.tbl.hairpins.log という名前の出力ファイルを見つけます。

4. 新規miRNAの同定

  1. sRNA-seq FASTQファイルを適切なFASTA形式に前処理します。必要に応じてアダプターをトリミングします。低品質の読み取りをトリミングしないでください。代わりに、それらを削除します。 N を含む読み取りを削除します。FASTQ ファイルを FASTA ファイル ($input_ファイル) に変換します。
  2. 以下に示すbashスクリプトを使用してmirMachineを実行します。
    bash mirMachine_submit.sh -f $genome_file -i $input_file -n $number_of_hits -sRNAseq -lmax $lmax -lmin $lmin -rpm $rpm
    注:sRNA-seqベースの予測では 、$mismatches を0に設定しました。
  3. 予測されたmiRNAを確認してください。予測されたmiRNAの $input_file.results.tbl.hairpins.tbl.out.tblという名前の 出力ファイルを見つけます。pre-miRNA FASTA配列の $input_file.results.tbl.hairpins.fsa という名前の出力ファイルを見つけます。ヘアピン ログ ファイルの $input_file.results.tbl.hairpins.log という名前の出力ファイルを見つけます。

5.アドバンスパラメータ

注:デフォルトは、ゲノムファイルと入力miRNAファイルを除くすべてのパラメーターに対して定義されています。

  1. -db オプションを blast データベースに設定して、パイプライン内の参照データベースの構築をスキップします。
  2. -m オプションを、許容される不一致の数に設定します。
    注:デフォルトでは、- m オプションは相同性ベースの予測の場合は1に設定され、sRNA-seqベースの予測の場合は0に設定されていました。
  3. -n を、アライメント後に削除するヒット数に設定します (デフォルトは 20)。種に基づいてこれを変更してください。
  4. -long を使用して、容疑者リストの 2 次構造を評価します。
  5. - s を使用して、sRNA-seqデータに基づく新規miRNA予測を活性化します。
  6. -lmax オプションを、スクリーニングに含める sRNA-seq リードの最大長に設定します。
  7. -lmax オプションを、スクリーニングに含める sRNA-seq リードの最小長に設定します。
  8. -rpm オプションを使用して、100 万回あたりの読み取り数 (RPM) しきい値を設定します。
    注:pri-miRNA/pre-miRNAの長さなどの高度なパラメータについては、経験豊富なユーザーが関心のある研究に合わせてスクリプトを変更することをお勧めします。さらに、ユーザーが一部の手順をスキップする場合、または変更された出力を使用する場合は、行の先頭に # を追加するだけで送信スクリプトを変更して、それらの行をスキップできます。

結果

上記のmiRNAパイプラインmirMachineを、パイプラインの性能を迅速に評価するための試験データに適用した。miRBase v22.1に寄託された高信頼植物miRNAのみを、IWGSCコムギRefSeqゲノムv224の染色体5Aに対してスクリーニングした。mirMachine_find、189個の高信頼miRNAの非冗長リストに対して312ヒットを返し、最大1個のミスマッチが許容されます(表1)。mirMachine_fold、二次構造評価...

ディスカッション

当社のmiRNAパイプラインSUmirは、過去10年間、多くの植物miRNAの同定に使用されてきました。ここでは、完全に自動化された、自由に利用できる新しいmiRNA同定およびアノテーションパイプラインmirMachineを開発しました。さらに、以前のパイプラインを含むがこれに限定されない多くのmiRNA同定パイプラインは、UNAfoldソフトウェア21に依存しており、UNAfoldソフトウェア21は、か...

資料

NameCompanyCatalog NumberComments
https://www.ncbi.nlm.nih.gov/books/NBK279671/Blast+
https://github.com/hbusra/mirMachine.gitmirMachine submission script
https://www.perl.org/get.htmlPerl
https://www.tbi.univie.ac.at/RNA/RNAfold
Arabidopsis TAIR10
Triticum aestivum (wheat, IWGSC RefSeq v2)

参考文献

  1. Voinnet, O. Origin, biogenesis, and activity of plant microRNAs. Cell. 136 (4), 669-687 (2009).
  2. Budak, H., Akpinar, B. A. Plant miRNAs: biogenesis, organization and origins. Functional & Integrative Genomics. 15 (5), 523-531 (2015).
  3. Lee, R. C., Feinbaum, R. L., Ambros, V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 75 (5), 843-854 (1993).
  4. Zhang, L., et al. Exogenous plant MIR168a specifically targets mammalian LDLRAP1: evidence of cross-kingdom regulation by microRNA. Cell Research. 22 (1), 107-126 (2012).
  5. Pang, K. C., Frith, M. C., Mattick, J. S. Rapid evolution of noncoding RNAs: Lack of conservation does not mean lack of function. Trends in Genetics. 22 (1), 1-5 (2006).
  6. Guleria, P., Mahajan, M., Bhardwaj, J., Yadav, S. K. Plant small RNAs: biogenesis, mode of action and their roles in abiotic stresses. Genomics, Proteomics and Bioinformatics. 9 (6), 183-199 (2011).
  7. Jones-Rhoades, M. W., Bartel, D. P., Bartel, B. MicroRNAs and their regulatory roles in plants. Annual Review of Plant Biology. 57, 19-53 (2006).
  8. Singh, A., et al. Plant small RNAs: advancement in the understanding of biogenesis and role in plant development. Planta. 248 (3), 545-558 (2018).
  9. Lucas, S. J., Budak, H. Sorting the wheat from the chaff: identifying miRNAs in genomic survey sequences of Triticum aestivum chromosome 1AL. PloS One. 7 (7), 40859 (2012).
  10. Li, S., Castillo-González, C., Yu, B., Zhang, X. The functions of plant small RNAs in development and in stress responses. Plant Journal. 90 (4), 654-670 (2017).
  11. Lee, Y., Jeon, K., Lee, J. T., Kim, S., Kim, V. N. MicroRNA maturation: Stepwise processing and subcellular localization. EMBO Journal. 21 (17), 4663-4670 (2002).
  12. Lee, Y., et al. MicroRNA genes are transcribed by RNA polymerase II. EMBO Journal. 23 (2), 4051-4060 (2004).
  13. Bartel, D. P. MicroRNAs: Genomics, biogenesis, mechanism, and function. Cell. 116 (2), 281-297 (2004).
  14. Lee, Y., et al. The nuclear RNase III Drosha initiates microRNA processing. Nature. 425 (6956), 415-419 (2003).
  15. Meyers, B. C., et al. Criteria for annotation of plant microRNAs. Plant Cell. 20 (12), 3186-3190 (2008).
  16. Sanei, M., Chen, X. Mechanisms of microRNA turnover. Current Opinion in Plant Biology. 27, 199-206 (2015).
  17. Li, J., Yang, Z., Yu, B., Liu, J., Chen, X. Methylation protects miRNAs and siRNAs from a 3′-end uridylation activity in Arabidopsis. Current Biology. 15 (16), 1501-1507 (2005).
  18. Rogers, K., Chen, X. Biogenesis, turnover, and mode of action of plant microRNAs. Plant Cell. 25 (7), 2383-2399 (2013).
  19. Axtell, M. J., Meyers, B. C. Revisiting criteria for plant microRNA annotation in the Era of big data. Plant Cell. 30 (2), 272-284 (2018).
  20. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10 (1), 421 (2009).
  21. Markham, N. R. N., Zuker, M. UNAFold: Software for nucleic acid folding and hybridization. Methods in Molecular Biology. 453, 3-31 (2008).
  22. Alptekin, B., Akpinar, B. A., Budak, H. A comprehensive prescription for plant miRNA identification. Frontiers in Plant Science. 7, 2058 (2017).
  23. Zhang, B., Pan, X., Cannon, C. H., Cobb, G. P., Anderson, T. A. Conservation and divergence of plant microRNA genes. Plant Journal. 46 (2), 243-259 (2006).
  24. Appels, R., et al. Shifting the limits in wheat research and breeding using a fully annotated reference genome. Science. 361 (6403), 7191 (2018).
  25. Wang, Y., Kuang, Z., Li, L., Yang, X. A bioinformatics pipeline to accurately and efficiently analyze the microRNA transcriptomes in plants. Journal of Visualized Experiments: JoVE. (155), e59864 (2020).
  26. Kozomara, A., Griffiths-Jones, S. MiRBase: Annotating high confidence microRNAs using deep sequencing data. Nucleic Acids Research. 42, 68-73 (2014).
  27. Lorenz, R., et al. ViennaRNA Package 2.0. Algorithms for Molecular Biology. 6 (1), 26 (2011).
  28. Wicker, T., et al. Impact of transposable elements on genome structure and evolution in bread wheat. Genome Biology. 19 (1), 103 (2018).
  29. Flavell, R. B., Bennett, M. D., Smith, J. B., Smith, D. B. Genome size and the proportion of repeated nucleotide sequence DNA in plants. Biochemical Genetics. 12 (4), 257-269 (1974).
  30. Wicker, T., et al. The repetitive landscape of the 5100 Mbp barley genome. Mobile DNA. 8, 22 (2017).
  31. Yang, Q., Ye, Q. A., Liu, Y. Mechanism of siRNA production from repetitive DNA. Genes and Development. 29 (5), 526-537 (2015).
  32. Lam, J. K. W., Chow, M. Y. T., Zhang, Y., Leung, S. W. S. siRNA versus miRNA as therapeutics for gene silencing. Molecular Therapy. Nucleic Acids. 4 (9), 252 (2015).
  33. Bartel, B. MicroRNAs directing siRNA biogenesis. Nature Structural and Molecular Biology. 12 (7), 569-571 (2005).
  34. Meng, Y., Shao, C., Wang, H., Chen, M. Are all the miRBase-registered microRNAs true? A structure- and expression-based re-examination in plants. RNA Biology. 9 (3), 249-253 (2012).
  35. Berezikov, E., et al. Evolutionary flux of canonical microRNAs and mirtrons in Drosophila. Nature Genetics. 42 (1), 6-9 (2010).

転載および許可

このJoVE論文のテキスト又は図を再利用するための許可を申請します

許可を申請

さらに記事を探す

171

This article has been published

Video Coming Soon

JoVE Logo

個人情報保護方針

利用規約

一般データ保護規則

研究

教育

JoVEについて

Copyright © 2023 MyJoVE Corporation. All rights reserved