キメラ低分子ノンコーディングRNAの計算解析チュートリアル:ターゲットRNAシーケンシングライブラリ

Sreenivas Eadara; Xinbei Li; Emily A. Eiss; Mollie K. Meffert

doi:10.3791/65779

このコンテンツを視聴するには、JoVE 購読が必要です。サインイン又は無料トライアルを申し込む。

Method Article

キメラ低分子ノンコーディングRNAの計算解析チュートリアル:ターゲットRNAシーケンシングライブラリ

DOI:

10.3791/65779

⸱

December 1st, 2023

Sreenivas Eadara¹, Xinbei Li¹, Emily A. Eiss¹, Mollie K. Meffert¹^,²

¹Department of Biological Chemistry, Johns Hopkins University School of Medicine, ²Solomon H. Snyder Department of Neuroscience, Johns Hopkins University School of Medicine

Please note that all translations are automatically generated. Click here for the English version.

要約

ここでは、 in vivo RNA:RNA相互作用の研究に使用されるキメラRNAシーケンシングデータを分析するためのバイオインフォマティクスパイプラインのインストールと使用を実証するプロトコルを紹介します。

要約

近年、マイクロRNA(miRNA)などの低分子ノンコーディングRNA(sncRNA)と標的RNAとのin vivo 遺伝子制御相互作用の理解が、キメラRNAの形成とその後のシーケンシングライブラリーを通じて、架橋とそれに続くライゲーションを使用してsncRNA:標的RNAの相互作用を捕捉する生化学的アプローチによって進められています。キメラRNAシーケンシングのデータセットは、miRNA予測ソフトウェアよりもゲノムワイドで曖昧さの少ないインプットを提供しますが、このデータを意味のある実用的な情報に抽出するには、追加の分析が必要であり、計算のバックグラウンドを持たない研究者を思いとどまらせる可能性があります。このレポートでは、エントリーレベルの計算生物学者が最新のオープンソースソフトウェアツールであるSmall Chimeric RNA Analysis Pipeline(SCRAP)をインストールして適用するためのチュートリアルを提供します。プラットフォームの要件、更新、およびパイプラインの手順と主要なユーザー入力変数の操作について説明します。生物学者がキメラRNAシーケンシングアプローチから洞察を得るための障壁を減らすことは、複数の生物学的状況における制御性sncRNAと標的RNAの相互作用の発見に基づく研究の出発点となる可能性があります。

概要

低分子ノンコーディングRNAは、分化や発生、シグナルプロセシング、疾患などの多様なプロセスにおいて、一連の遺伝子からの発現を調整する転写後の役割について高度に研究されています^1,2,3。マイクロRNA(miRNA)を含む遺伝子制御低分子ノンコーディングRNA(sncRNA)の標的転写産物を正確に決定する能力は、基礎レベルと翻訳レベルの両方でRNA生物学の研究にとって重要です。miRNAシード配列とその潜在的な標的との間に予想される相補性を利用するバイオインフォマティクスアルゴリズムは、miRNA:標的RNA相互作用の予測に頻繁に使用されています。これらのバイオインフォマティクスアルゴリズムは成功していますが、他の場所でレビューされているように、偽陽性と偽陰性の両方の結果を隠す可能性もあります^4,5,6。最近、いくつかの生化学的アプローチが設計され、実装されており、in vivo架橋とそれに続くライゲーションステップの組み込みにより、in vivoでのsncRNA:標的RNA相互作用の明確かつ半定量的な決定が可能になり、sncRNAを標的に物理的に結合させて単一のキメラRNA 4,5,7,8,9,10を形成します.その後、キメラRNAからシーケンシングライブラリを調製することで、シーケンシングデータの計算処理により、sncRNA:標的RNAの相互作用を評価することができます。このビデオでは、キメラRNAシーケンシングライブラリ6からsncRNA:target RNA相互作用の頑健で再現性のある解析を可能にするように設計された、small chimeric RNA analysis pipeline(SCRAP)と呼ばれる計算パイプラインをインストールして使用するためのチュートリアル^{を提供します。}

このチュートリアルの目的は、sncRNA:標的RNA相互作用のキメラ分子読み出しを提供する生化学的アプローチによって生成されたデータの分析に対する障壁を下げることにより、研究者が純粋に予測的なバイオインフォマティクスアルゴリズムへの過度の依存を回避するのを支援することです。このチュートリアルでは、ハイブリッドの架橋、ライゲーション、シーケンシング(CLASH)や内因性アルゴノート結合RNAの共有結合ライゲーション(CLEAR-CLIP⁾^7,9など、いくつかの既存の生化学プロトコルによって生成できるキメラRNAシーケンシングデータを解析するために開発されたパイプラインSCRAPを使用して、エントリーレベルの計算科学者をガイドするための実践的な手順とヒントを提供します。

SCRAPの使用は、他の計算パイプラインと比較して、キメラRNAシーケンシングデータの解析にいくつかの利点^{を提供します6。}顕著な利点の 1 つは、パイプライン内のステップでカスタムおよび/またはサポートされていないスクリプトに依存することが多い代替パイプラインと比較して、パイプライン内の広範な注釈と、十分にサポートされ、定期的に更新されるバイオインフォマティクススクリプトへのコールアウトの組み込みです。この機能により、SCRAPは安定性が高まり、研究者がパイプラインに慣れ親しみ、その使用をワークフローに組み込むことがより価値のあるものになります。また、SCRAPは、sncRNA:target RNA相互作用のピークの呼び出しにおいて、他のパイプラインよりも優れた性能を発揮し、クロスプラットフォーム機能を持つことが実証されています(以前の出版物⁶で詳述)。

このチュートリアルを修了すると、ユーザーは (i) SCRAP のプラットフォーム要件を把握して SCRAP パイプラインをインストールし、(ii) リファレンスゲノムをインストールし、SCRAP のコマンドラインパラメータを設定し、(iii) ピーク呼び出し基準を理解し、ピーク呼び出しとピークアノテーションを実行できるようになります。

このビデオでは、RNA生物学を研究する研究者が、シーケンシャルライブラリ調製に対する生化学的アプローチの1つを通じて得られたキメラRNAシーケンシングデータにおいて、メッセンジャーRNAなどの標的RNAとのsncRNA相互作用を解析するために、計算パイプラインSCRAPをインストールし、最適に使用する方法を実践的に詳細に説明します。

SCRAPはコマンドラインユーティリティです。一般的に、以下のガイドに従って、ユーザーは(i)SCRAPをダウンロードしてインストールし(https://github.com/Meffert-Lab/SCRAP)、(ii)リファレンスゲノムをインストールしてSCRAPを実行し、(iii)ピークコールとアノテーションを実行する必要があります。

この手順の計算手順の詳細については、https://github.com/Meffert-Lab/SCRAP を参照してください。この記事では、エントリーレベルの計算スキルを持つ研究者がキメラRNAシーケンシングライブラリデータセットにSCRAPをインストール、最適化、および使用できるようにするためのセットアップと背景情報を提供します。

Access restricted. Please log in or start a trial to view this content.

プロトコル

注:プロトコルは、SCRAPを使用してキメラRNAシーケンシングライブラリを解析するために必要なソフトウェアのダウンロードとインストールから始まります。

1. インストール

SCRAP をインストールする前に、分析に使用するマシンに依存関係 Git と Miniconda をインストールします。Git は既にインストールされている可能性があります。たとえば、Mac OSXプラットフォームでは、どのgitを使用してこれを検証し、「 git 」ユーティリティが存在し、このディレクトリにインストールされていることを確認します。Minicondaが どのcondaを使用してインストールされているかを確認します。何も返されない場合は、Miniconda をインストールします。Miniconda のインストールには 400 MB のディスク容量が必要です。
1. Miniconda をインストールする方法はいくつかあり、プラットフォームによって異なります。Windows、MacOS、Ubuntu へのインストールに関する詳細な手順については、Meffert Lab GitHub リポジトリ [https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md] の PLATFORM-SETUP マークダウンファイルを参照してください。Linuxユーザーの場合、Linuxには独自のデフォルトパッケージマネージャー(apt)があります。この調査に固有のケースでは、コマンド brew install Miniconda を使用して、既存のパッケージマネージャー brew を使用して Miniconda をインストールします。
  注:「brew」と呼ばれる「Homebrew」は、AppleのオペレーティングシステムであるmacOSへのソフトウェアのインストールを簡素化するオープンソースのソフトウェアパッケージ管理システムです。
2. conda を初めてインストールする場合は、使用中の特定のシェルに対して conda init を実行します。この例では、使用されているシェルは zsh です。次に、シェルを閉じてから再度開きます。conda が正常にインストールされた場合は、ターミナルセッション内でアクティブ化された基本環境が表示されます。
SCRAP ソースをダウンロードし、その依存関係をインストールします。
1. SCRAPソースを取得するための推奨される方法は、Gitを使用することです。これにアクセスするには、git clone https://github.com/Meffert-Lab/SCRAP を実行してソースコードの最新のコピーを取得します。
2. condaの改良されたパッケージ・ソルバーであるmambaをインストールし、次のコマンドを使用して、SCRAP_environment.ymlから独自のconda環境にSCRAPのすべての依存関係をインストールします。
  conda install -n base conda-forge::mamba (コンダインストール -n ベース conda-forge::マンバ)
  マンバenvは、-fスクラップ/ SCRAP_environment.yml -nスクラップを作成します
次に、SCRAP のリファレンスインストールを実行します。リファレンスインストールで使用される引数は、sncRNA-mRNA相互作用が分析されている生物に固有です。
bash SCRAP / bin / Reference_Installation.sh -r full / path / to / SCRAP / -mは-g hg38 -s humanを持っています
1. リファレンスインストール用のSCRAPソースフォルダのディレクトリを指定します。インストール手順は、 fasta および annotation フォルダー内のファイルを使用して実行されます。省略せずにフルパスを一覧表示します。スラッシュで終わります。
2. miRbase の正しい種の略語については、 README.md の表を参照してください。最新の参照ゲノムは、https://genome.ucsc.edu/ または https://www.ncbi.nlm.nih.gov/data-hub/genome/ で見つけることができます。この例では、hg38 をマウスGRCm38ゲノムに使用します。
3. 現在、アノテーションの対象種は、ヒト、マウス、ワームです。SCRAPソースフォルダのannotationディレクトリにある対応するspecies.annotation.bedファイルを表示します。分析に別の種を使用する場合は、同じ命名スキーム species.annotation.bed に従う annotation.bed ファイルを指定します。

2. SCRAPの実行

依存関係とSCRAPがインストールされたので、スクリプトを実行します SCRAP.sh
bashのスクラップ/ bin / SCRAP.sh -d フル/パス/ツー/CLASH_Human/ -a フル/パス/ツー/CLASH_Human/CLASH_Human_Adapters.txt -p no -f はい -r full/path/to/SCRAP/ -m は -g hg38 です。
1. サンプルディレクトリへのパス全体を省略せずに一覧表示します。 図 1 に示すように、サンプル名と完全に一致するフォルダー名でサンプル・ディレクトリーをフォーマットします。
2. リストされているパスは、すべてのサンプルフォルダを含むディレクトリへのパスであり、個々のサンプルフォルダやサンプルファイルへのパスではありません(手順2.1のコマンドラインを参照)。
3. 次に、アダプターファイルへのパス全体を一覧表示します。アダプタファイル内のサンプル名が、前述のフォルダ名およびファイル名と一致していることを確認します(手順2.1のコマンドラインを参照)。
4. サンプルがペアエンドであるかどうか、およびpre-miRNAおよび/またはtRNAのフィルタリングを実行するかどうかを示します。必要に応じて、rRNAクリーニング用のフィルターを追加します(ステップ2.1のコマンドラインを参照)。
  注:ユーザーは、サンプルの種類と実験目標に応じて、これらのフィルターを使用することを決定する場合と使用しない場合があります。実験デザインに応じて、pre-miRNA、tRNA、およびrRNAは、実際のsncRNA:target RNAキメラの利用可能なシーケンシング深度を消費する可能性があり、ユーザーはフィルターを使用してそれらを除外できます。ただし、特定の状況では、このようなフィルタリングを避けたい場合があります(たとえば、ミトコンドリアrRNAを含むミトコンドリアゲノムにsncRNAターゲットをマッピングするなど)。
5. 次に、参照ディレクトリへのパス全体、miRbaseの省略形、および参照ゲノムの省略形をリストします(手順2.1のコマンドラインを参照)。
  注: スクリプトは、データセットのサイズと使用しているコンピューターの CPU によっては、完了するまでに数時間かかる場合があります。

3. ピークコールとアノテーション

SCRAP の実行が終了したら、出力に他のファイルと共に SAMPLE.aligned.unique.bam ファイルが含まれていることを確認します。これは、ユーザーが提供した参照ゲノムへのターゲットRNAのアライメントを含むバイナリファイルです。
次に、Peak_Calling.shを実行してピークコールを実行します。
bash SCRAP/bin/Peak_Calling.sh -d CLASH_Human/ -a CLASH_Human/CLASH_Human_Adapters.txt -c 3 -l 2 -f no -r SCRAP/ -m は -g hg38 を持っています。
注:ピークコールはSCRAPの機能であり、研究者がキメラRNAライブラリー内の最も頑健で再現性の高い低分子ノンコーディングRNA:標的RNA相互作用を容易に評価できるように設計されています。たとえば、この機能は、研究者がさらなる調査のために選択したい相互作用を特定するのに役立ちます。以下のステップ 3.2.2 では、ピークが呼び出される厳密さを定義するために使用する基準をユーザーが設定する方法について説明します (これには、ピークが呼び出されるために発生した必要がある一意の相互作用またはシーケンシングリードの数と、この特定の相互作用が発生している必要があるライブラリの数が含まれます)。
1. ここでも、サンプルフォルダを含むディレクトリへのフルパスとアダプタファイルをリストします(ステップ3.2のコマンドラインを参照)。
2. 次に、ピークを呼び出すために必要なシーケンシングリードの最小数を設定します(ステップ3.2のコマンドラインを参照)。
3. 呼び出すためにピークを含む必要がある個別のシーケンシングライブラリの最小数を設定します(ステップ3.2のコマンドラインを参照)。
  注: 3.2.2 と 3.2.3 の両方の値の選択は、シーケンスされたサンプルの性質と、サンプルの数またはサンプルの種類によって異なります。ここで、ピークを呼び出すには、サンプル中の少なくとも3つのキメラシーケンシングリードが必要であり、ピークは少なくとも2つのサンプルによって支持されていなければならない。例えば、特定の条件に対して多くのシーケンシングライブラリーの複製があるデータセットを評価する研究者は、より多くのサンプルシーケンシングライブラリーにリードが存在することを要求することを決定するかもしれません。
4. 同じファミリーの sncRNA が同じピークに寄与する必要があるかどうかを示します。例えば、同じファミリーのmiRNAはシード配列を共有するため、これらのmiRNAは、共有および重複する遺伝子標的のセットに結合することができます。ユーザーは、集合的なピークを評価することで、これらのターゲットに対するファミリの完全な影響を特定できます(手順3.2のコマンドラインを参照)。
5. 次に、参照ディレクトリへのフルパス、miRBase の省略形、および参照ゲノムの省略形を指定します (手順 3.2 のコマンドラインを参照)。
ピーク呼び出しが完了したら、ピークアノテーションを実行します。
bashスクラップ/ bin / Peak_Annotation.sh -p CLASH_Human / peaks.bed -r SCRAP / -s人間
1. ピーク呼び出しから得られたpeaks.bed(または peaks.family.bed )ファイルへのフルパス、参照ディレクトリへのフルパス、およびアノテーションに必要な種をリストします。

4. データの可視化

注:これで、SCRAPを使用した分析のすべての手順が完了しました。データを視覚化するには、いくつかの方法をお勧めします。

視覚化するすべての .bam (バイナリ SAM ファイル) ファイルをマージします (samtools merge)。
マージされた結果の .bam ファイルをソートします (samtools sort)。ファイルの内容は、samtools がインデックスを作成できるように、行ごとにソートされます。
ソートされた .bam ファイルにインデックスを付けます (samtools index)。BAI(バイナリsamtoolsフォーマットインデックス)ファイルが生成され、統合ゲノミクスビューア(IGV)での可視化が可能になります。
最後に、並べ替えられた .bam とインデックス付きの .bai ファイルを IGV で開きます。
注:SncRNA:ターゲットRNA相互作用は、いくつかの調査固有の方法でフォローアップのために優先順位を付けることができます。一般的な初期アプローチの 1 つは、最もキメラなシーケンシングリードによってどのピークが支持される相互作用を評価することです。関心のある相互作用は、検出された相互作用からのsncRNAおよび標的RNAの両方についての配列を入力することにより、RNAstructureパッケージからDuplexFoldウェブサーバを用いて視覚化することもできる¹¹。各ピークについて、染色体(第1列)とゲノム座標(開始:第1列、終了:第2列)は、ピークアノテーションで生成されたpeaks.bed.species.annotation.txtファイル内にあります。特にmiRNAでは、再現性のある機能的相互作用は広範なシードマッチド結合を欠いている可能性がありますが(例えば、相互作用は3'代償結合を使用する可能性があります)、ターゲットRNAの同族結合モチーフにおけるシードマッチド部位の存在は、機能的に重要な検出された相互作用の検証的特徴として評価することができます^4,12。.補助的なデータ処理には、異なる生物学的条件におけるピーク間の差異リードカバレッジの比較や、経路解析ツールを用いた経路への制御遺伝子のクラスタリングの評価が含まれる可能性があります。

Access restricted. Please log in or start a trial to view this content.

結果

CLEAR-CLIP⁹ を用いて作製した既公開のシークエンスデータセットについて、SCRAPの改変版(rRNAフィルタリングの改良を施したSCRAPリリース2.0)で検出したsncRNA:target RNAの結果を図2 および表1に示します。ユーザーは、SCRAPでのピークコールによる信頼性の高い相互作用の分離後に発生するイントロン領域との相対的な分画miRNA相互作用の減少を?...

Access restricted. Please log in or start a trial to view this content.

ディスカッション

sncRNA:標的RNA相互作用の分析のためのSCRAPパイプラインの使用に関するこのプロトコルは、計算分析に入ろうとしている研究者を支援するように設計されています。チュートリアルの完了は、このパイプラインのインストールと使用、およびキメラRNAシーケンシングライブラリから得られたデータを分析するためのそのアプリケーションに必要な手順を通じて、エントリーレベル以上の計算経?...

Access restricted. Please log in or start a trial to view this content.

開示事項

著者は何も開示していません。

謝辞

BH Powell氏やWT Mills IV氏など、有益な議論をしてくれたMeffert研究所のメンバーに、パイプラインの設置と実施に関する重要なフィードバックをいただいたことに感謝します。この研究は、Braude Foundation賞、Maryland Stem Cell Research Fund Launch Program、Blaustein Endowment for Pain Research and Education賞、NINDS RO1NS103974およびNIMH RO1MH129292 to M.K.M.の支援を受けました。

Access restricted. Please log in or start a trial to view this content.

資料

Name	Company	Catalog Number	Comments
Genomes	UCSC Genome browser	N/A	https://genome.ucsc.edu/ or https://www.ncbi.nlm.nih.gov/data-hub/genome/
Linux	Linux	Ubuntu 20.04 or 22.04 LTS recommended
Mac	Apple	Mac OSX (>11)
Platform setup	GitHub	N/A	https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md]
SCRAP pipeline	GitHub	N/A	https://github.com/Meffert-Lab/SCRAP
Unix shell	Unix operating system	bash >=5.0
Unix shell	Unix operating system	zsh (5.9 recommended)
Windows	Windows	WSL Ubuntu 20.04 or 22.04 LTS

参考文献

Morris, K. V., Mattick, J. S. The rise of regulatory RNA. Nature Reviews Genetics. 15 (6), 423-437 (2014).
Li, X., Jin, D. S., Eadara, S., Caterina, M. J., Meffert, M. K. Regulation by noncoding RNAs of local translation, injury responses, and pain in the peripheral nervous system. Neurobiology of Pain (Cambridge, Mass.). 13, 100119(2023).
Shi, J., Zhou, T., Chen, Q. Exploring the expanding universe of small RNAs. Nature Cell Biology. 24 (4), 415-423 (2022).
Broughton, J. P., Lovci, M. T., Huang, J. L., Yeo, G. W., Pasquinelli, A. E. Pairing beyond the seed supports microRNA targeting specificity. Molecular Cell. 64 (2), 320-333 (2016).
Grosswendt, S., et al. Unambiguous identification of miRNA:target site interactions by different types of ligation reactions. Molecular Cell. 54 (6), 1042-1054 (2014).
Mills, W. T., Eadara, S., Jaffe, A. E., Meffert, M. K. SCRAP: a bioinformatic pipeline for the analysis of small chimeric RNA-seq data. RNA. 29 (1), 1-17 (2023).
Helwak, A., Kudla, G., Dudnakova, T., Tollervey, D. Mapping the human miRNA interactome by CLASH reveals frequent noncanonical binding. Cell. 153 (3), 654-665 (2013).
Hoefert, J. E., Bjerke, G. A., Wang, D., Yi, R. The microRNA-200 family coordinately regulates cell adhesion and proliferation in hair morphogenesis. Journal of Cell Biology. 217 (6), 2185-2204 (2018).
Moore, M. J., Zhang, C., Gantman, E. C., Mele, A., Darnell, J. C., Darnell, R. B. Mapping Argonaute and conventional RNA-binding protein interactions with RNA at single-nucleotide resolution using HITS-CLIP and CIMS analysis. Nature Protocols. 9 (2), 263-293 (2014).
Bjerke, G. A., Yi, R. Integrated analysis of directly captured microRNA targets reveals the impact of microRNAs on mammalian transcriptome. RNA. 26 (3), 306-323 (2020).
Reuter, J. S., Mathews, D. H. RNAstructure: software for RNA secondary structure prediction and analysis. BMC Bioinformatics. 11 (1), 129(2010).
Moore, M. J., et al. miRNA-target chimeras reveal miRNA 3′-end pairing as a major determinant of Argonaute target specificity. Nature Communications. 6 (1), 8864(2015).
Travis, A. J., Moody, J., Helwak, A., Tollervey, D., Kudla, G. Hyb: a bioinformatics pipeline for the analysis of CLASH (crosslinking, ligation and sequencing of hybrids) data. Methods (San Diego, Calif.). 65 (3), 263-273 (2014).

Access restricted. Please log in or start a trial to view this content.

転載および許可

このJoVE論文のテキスト又は図を再利用するための許可を申請します

許可を申請

さらに記事を探す

JoVE 202

This article has been published

Video Coming Soon

Keep me updated: