miRDeep2は、植物開発において重要な転写調節因子であり、環境問題への対応に不可欠な植物マイクロRNAを正確に特定するために使用できます。miRDeep2は著しく短い実行時間を必要とし、特に大きなゲノムを有する植物のマイクロRNAを予測するために感度と精度の両方で優れた性能を発揮します。偽陽性と長い処理時間は、植物マイクロRNAアノテーションにおける課題です。
新しいフィールディング戦略を追加し、スコアリングアルゴリズムを見直し、厳しい基準を統合することで、miRDeep2はこれらの問題を克服することができます。高信頼マイクロRNAアノテーションは、ゲノムの多様な機能を調節する上でのマイクロRNAの役割を発見するための基本です。ステップバイステップのガイダンスは、初めてマイクロRNAアオナタを使用するのに役立ちます。
経験豊富な研究者にとって、この方法は他のツールよりもmiRDeep2を使用することの利点と利点を理解するのに役立ちます。miRDeep2 パッケージをインストールするには、miRDeep2 Web ページに移動して、tarball ファイルを取得します。次に、ダウンロードしたファイルのすべての内容を 1 つのフォルダーに展開し、フォルダーパスをパスに設定します。
miRDeep2パイプラインをテストするには、テストデータと1つのフォーマットされたGSMシーケンシングファイルと1つのシロイヌナナゲノムファイルを含む予想出力をダウンロードし、ダウンロードしたすべてのファイルを現在の作業ディレクトリに移動します。圧縮されたタールボールファイルを抽出した後、シロイヌナズナのゲノム参照インデックスと非コードRNA参照インデックスを構築します。中間ファイルと結果をすべて含むuser_selected_folderに、フォルダが自動的に生成されます。
miRDeep2 パイプラインは、テストデータを使用して実行できます。テスト出力を確認するには、タブ区切り出力ファイルを表示します。予測されたマイクロRNAの最終的な出力には、染色体ID、ストランド方向、代表的な読み取りID、前駆体ID、成熟miRNA位置、前駆体位置、成熟配列および前駆体配列を示すカラムが含まれます。
次に、完了したステップに関する情報を提供するprogress_logファイルと、プログラムの出力と警告を含むscript_logファイルとscript_errファイルを確認します。パイプラインを実行する前に、入力読み取りが適切な形式に前処理されていることを確認するには、深いシーケンスの読み取りの 5 つの素端と 3 つの素端からアダプターを削除し、すべての FAST A 識別子が一意であることを確認します。各シーケンス識別子は、アンダースコア x と、深いシーケンス データセットで取得された正確なシーケンスのコピー番号を示す整数で終わる必要があります。
一意のFAST A識別子を確保するために、参照インデックスを構築ID.Toにランニング番号を含め、対象の種のゲノム配列がインデックス化されている場合は、iGenomesウェブサイトからBowtie 2インデックスファイルをダウンロードしてください。次に、リボソームRNAを含むRNAファムからの主要な非コード配列を含む非マイクロRNA非コードRNAインデックスを構築し、RNA、小核RNA、小核核RNAを伝達し、他の非コードRNAフラグメントから騒々しい配列を除外する。miRDeep2 を使用して、深いシーケンスデータから新しいマイクロRNA を検出するには、パッケージ内で bash スクリプトを実行して分析パイプラインを開始します。
読み取り先の異なる場所の数、Bowtie 2 を実行するための不一致数、および 100 万分の 1 読み取りのしきい値を必要に応じて変更できます。miRDeep2 出力を確認するには、自動生成されたoutput_folderのデータを表示します。この代表的な分析では、miRDeep2マイクロRNAアノテーションパイプラインを、示されたとおりに徐々に増加したゲノムサイズを有する5つの植物種から10のパブリックsRNA配列ライブラリに適用した。
各種について、異なる組織からの2つの代表的な小RNAライブラリーとそのインデックスゲノム配列が2つの入力として処理される。以前の方法を使用すると、ゲノム処理には100時間以上かかるか、ゲノムの長さのために解析の途中で停止する場合があります。ただし、miRDeep2 は、これらの予測プロセスを、数分から時間まで著しく短い期間で終了します。
このテストで使用された2つの配列付きシロイヌナズナシスの小さなRNAについては、miRDeep2は他のツールと比較して感度と精度の両方でより優れたパフォーマンスを発揮しました。プログラムの入力インデックスが正しいことを確認してください。たとえば、Bowtie インデックスでのみ Bowtie を使用し、大きなゲノムには大きなインデックス オプションを使用します。
得られたマイクロRNAの標的は、マイクロRNA機能に関する洞察を提供できるシーケンシングデータを使用して予測することができる。miRDeep2は、特定の植物種におけるほとんどのマイクロRNAを正確かつ敏感に同定するために使用することができるので、マイクロRNA機能全体としての役割を検討することができる。