環状RNAは、さまざまな生物学的プロセスにおいて重要な調節的役割を果たします。このプロトコルは、初心者が宿主と病原体の相互作用の分野で環状RNA分析を実行するのに適しています。ここでは、安全なRNAの予測と定量、安全なRNA機能強化、安全なRNA、マイクロRNA相互作用の予測、CCE RNAネットワークの構築に必要な合理化されたプロトコルを作成するツールをいくつかまとめました。
この合理化プロトコルを臨床サンプルに適用して、宿主と病原体の相互作用設定における特定の候補、診断値、予後値を特定することができます。プログラミングの予備知識がない人は、この手法の初期段階を行うのに苦労すると思います。したがって、この手法で使用されるプログラミング言語の基本を学ぶことをお勧めします。
私は通常、プログラミング言語がどのように適用されているかを見て、一人で読むよりも有益で理解しやすいと思います。Linuxターミナルを開き、ホストの参照ゲノムのディレクトリでコマンドを実行するには、bwaインデックスとhisat2-buildコマンドを実行してゲノムにインデックスを付けます。ファイルの名前、ツールのパス、ダウンロードした参照ファイルへのパス、およびインデックスファイルへのパスを含むyml構成ファイルを準備します。
RNA配列データのライブラリタイプを指定し、デフォルトまたは手動パラメータを使用してCiriquantツールを実行します。RNA配列データのID、Ciriquantが出力するGTFファイルへのパス、RNA配列データのグループ分け(対照群か治療群か)を含むデータのリストを含むテキストファイルを準備します。Linuxターミナルで、準備されたテキストファイルを入力としてprep_Ciriquantを実行します。
この実行により、ファイルの一覧が生成されます。RNA配列IDとそれぞれの文字列タイ出力へのパスを含むデータのリストを含む2番目のテキストファイルを準備します。ファイルレイアウトは、グループ化列を実行せずに、以前に準備したテキストファイルと同様である必要があります。
prepde を実行します。pyは、このテキストファイルを入力として、遺伝子数マトリックスファイルを生成します。library_infoでCiri_DE_Replicateを実行します。
csv, circRNA_BSJ.CSV および gene_count_matrix。最終circRNA_DEを出力するための入力としてcsvファイル。
TSV ファイルにエクスポートします。差次的に発現する(DE)circRNAの数をフィルタリングして決定するには、circRNA_DEを開きます。tsvファイルをRまたはその他の表計算ソフトウェアでファイルを作成します。
WinRarや7-Zipなどの関連ソフトウェアを使用して、CircR GitHubページからダウンロードした後、CircRファイルの内容を解凍して抽出します。分析が行われる新しいディレクトリに移動します。次に、circRNAミRNA分析を実行する前に、SAMTools、miRanda、RNAhybrid、Pybedtoolsなどの前提条件となるソフトウェアアプリケーションをインストールします。
SAMtools FAIDXコマンドを使用して目的の生物の参照ゲノムファイルにインデックスを作成し、タブ区切りのベッドファイルで目的のDE circRNAの座標で構成される入力ファイルを準備します。次に、サーカーを実行します。Python3を使用してpy。
また、引数として、circRNA入力ファイル、目的の生物のより高速なゲノム、選択した生物のゲノムバージョン、スレッド数、およびコマンドラインの出力ファイルの名前を指定します。Circr解析が完了すると、プログラムはcsbox形式でcircRNA-miRNA相互作用ファイルを出力します。目的のcircRNAとその標的miRNAを含むタブ区切りファイルを準備します。
最初の列は circRNA 名で構成されています。2 番目の列は、最初の列の RNA の種類を指定します。3番目の列はターゲットmiRNAです。
そして4番目の列は3番目の列からのRNAの種類を指定します。ceRNAネットワークマップを構築するには、Cytoscapeソフトウェアを開き、ファイルに移動し、インポートし、ファイルからネットワークを作成し、準備したファイルを選択してアップロードします。スタイルボタンを押して、ネットワークの表示スタイルを変更します。
次に、塗りつぶし色の右側にある矢印を押して、カラムのタイプを選択し、マッピングタイプの離散マッピングを選択して、各RNAタイプに必要な色を選択します。その後、shapeに移動してノードの形状を変更し、前に示した手順に従います。circRNAの親遺伝子の遺伝子オントロジーとKEGG分析については、クラスタープロファイラーと組織を確認してください。Hs.eg。
DBパッケージがスタジオにインストールされました。DE circRNA 情報を R スタジオワークスペースにインポートします。ユーザーが親遺伝子名をentrezidなどの他の形式に変換したい場合は、bidderなどの関数を使用します。
遺伝子 ID を入力として使用し、デフォルトのパラメーターを使用してクラスター・プロファイルまたはパッケージ内の enrichGO 関数を使用して、遺伝子オントロジーおよびエンリッチメント分析を実行します。最後に、遺伝子 ID を入力として使用し、クラスタープロファイラーパッケージ内の enrichKEGG 関数を使用して、KEGG エンリッチメント分析を実行します。親遺伝子のDE circRNAの遺伝子オントロジー濃縮分析のバブルプロットをこの図に示します。
x軸の遺伝子比率は、特定の遺伝子オントロジー用語に関連付けられた入力リスト内の遺伝子の数を、その用語の遺伝子の総数で割ったものです。プロット内のドットサイズは、特定の遺伝子オントロジー用語に関連付けられた入力リスト内の遺伝子の数であるカウント値によって表されます。ドットのサイズが大きいほど、用語に関連する入力遺伝子の数が多くなります。
プロット内のドットは、注釈項の観測頻度と偶然に予想される頻度を比較することによって計算されるpvalueに基づいて色分けされています。情報付加は統計的に有意であり、p値が0.01未満の場合にのみバブルプロットにプロットされます。ここで、生物学的プロセスの上位3つの濃縮には、リボ核タンパク質複合体の生合成、ウイルスへの応答、および生物刺激に対する応答の調節が含まれます。
一方、分子機能については、RNAに作用する触媒活性と一本鎖RNA結合のみが統計的に濃縮されています。細胞成分については、レトロマー複合体のみが統計的に濃縮されている。この代表的な画像は、DE circRNA親遺伝子のKEGG濃縮分析をバブルプロットで示しています。
この場合、KEGGの用語が濃縮されたのは、インフルエンザAとウイルスのライフサイクル経路の2つだけでした。この手順を試みる際の最も重要なことの1つは、傷害を実行するときに使用しているRNAサークデータセットの正しい形質タイプを確認することです。ここで提供されるバイオフォーマティックパイプラインは、潜在的な長期RNAと機能アノテーションを予測するのに役立ちます。
ただし、確かな証拠を提供するには、十分に主導された検証が必要です。このプロトコルにより、研究者は安全なRNAと、さまざまなコードや病原体の相互作用におけるそれらの潜在的な機能的役割を発見し、さらに研究することができます。