CorExplorerは、インタラクティブな視覚化を使用して数学的に原理化された方法で腫瘍関連遺伝子発現因子を発見し、生物学的発見のための臨床およびデータベース情報を見つけます。CorEx は、高次元データ内のクラスターを見つけるために比較的少数のサンプルを必要とする方法で情報の最大化を実行します。それが生み出す潜在的な要因の階層は、生物学的理解を促進する。
この方法は、がん生物学に適用すると、すでに興味深いことが証明されています。情報理論の基盤は、多くの変数とそれらの関係に関するほとんど事前知識を持つ任意のシステムに適用可能にします。まず、CorExplorer のホームページに移動します。
[クイック リンク] の下の [+] をクリックすると、対象のがんデータについてトレーニングされた CorEx ファクター グラフの概要が表示されます。例えば、ここでは、TCGA卵巣癌データの因子グラフを示す。因子グラフを調べ、肺TCGA-LUADをクリックして肺がんRNAシーケンシングのCorExplorerページにアクセスし、CorExplorerファクターグラフウィンドウを使用して目的の遺伝子のCorExファクターグラフを探索します。
マウスカーソルを因子グラフ表示ウィンドウの上に移動させながら、マウストラックパッドを使用して因子グラフを拡大表示し、各因子の最も重要な遺伝子や異なるレイヤーのノード間の接続など、グラフの詳細を表示します。ターゲット遺伝子を見つけるには、[遺伝子]メニューをクリックし、遺伝子名を入力して、ドロップダウンリストから選択します。キーボードの Return キーを押して、目的の遺伝子が最も強く相関している因子に対してビューをズームします。
マウスをグラフ表示の上に移動し、スクロールして縮小表示し、最も密接に関連付けられた遺伝子因子に隣接するノードと関連する因子のレベルを表示します。[最小リンク ウェイト] スライダーで示されたしきい値を超える重みを持つジーンのみが表示されます。因子に関連付けられているすべての遺伝子を表示するには、該当するノードをクリックし、ポップアップウィンドウで[追加の遺伝子をロード]を選択します。
[完了] が表示されたら、ポップアップ ウィンドウを閉じます。ヘッダー セクションで、[最小リンク ウェイト] モディファイヤをクリックして 0.05 にドラッグし、ジーンを重みの順序で表示できるようにします。生物学的関数との関連を識別するには、[アノテーション] ウィンドウで[誤検出率の並べ替え]をオフにして、[因子]ドロップダウンメニューを偽検出率ではなく因子番号で並べ替えます。
スクロールして、[アノテーション] ウィンドウのドロップダウン メニューで目的の係数を選択し、因子のエンリッチメントアノテーションを表示します。次に、エンリッチメント係数をクリックして、関連する遺伝子をグラフ表示で黄色でハイライト表示してすぐに表示します。異なる GO 項として表示される要因は、選択したアノテーションを持つ遺伝子に対して富化されるかどうかに応じて選択されることに注意してください。
目的のフィルター係数の場合、生存率とクラスターの品質を使用して、[データセット]ドロップダウン メニューから[TCGA_OVCAを選択して、TCGA 卵巣癌 RNA シーケンシングの CorExplorer ページに移動します。[生存期間] ウィンドウで最大生存率の係数をメモし、[因子グラフ] ウィンドウの [因子] ドロップダウン メニューからこの係数を選択します。[リンクウェイト]スライダをクリックして0.5にドラッグし、因子の遺伝子数をメモします。
[サバイバル]ウィンドウで因子のリストを展開し、[生存期間]ドロップダウンで次によい因子をクリックして、関連する生存曲線を表示します。重要な GO およびケッグの注釈が表示されます。この因子における遺伝子の生物学的役割をより深く理解するには、因子グラフウィンドウの上部にある因子レイヤーを選択し、ズームアウトしながらマウスをウィンドウの上に移動して、クラスター全体および関連する因子を明らかにします。
クラスターノードにリンクされている因子の相対的な有意性を理解するには、[生存期間] ウィンドウで[p-valで並べ替え]をオフにし、連続して各因子番号をクリックして表示し、生存率の関連を表示する因子を示します。[ウィンドウの追加]メニューで[PPI]を選択し、[追加]をクリックして表示領域にPPIグラフウィンドウを追加します。PPIグラフウィンドウで、有意なタンパク質とタンパク質の相互作用を表示するために、関心のある因子層を選択します。
[文字列 DB で表示] リンクをクリックして、STRINGdb オンライン データベースに接続し、[続行] をクリックします。次に、Anaylsis タブを開いて、PPI ネットワーク遺伝子のオンライン GO 分析を取得します。上部のセルラー コンポーネントが表示されます。
CorExplorer タブと PPI ウィンドウに戻り、別の要素を選択します。[文字列 DB で表示] リンクを再度クリックします。別の上位のセルラー コンポーネントが表示されます。
次に、PPI ウィンドウで、STRING データベース分析の別の要因を選択します。腫瘍タイプ間の遺伝子発現変動の共通点と違いを見つけるには、CorExplorerの見出しをクリックしてフロントページに戻り、[検索]をクリックしてCorExplorerサイト上のすべてのデータセットを検索できるページにアクセスします。[遺伝子検索]ボックスに対象の遺伝子名を入力し、[検索]をクリックします。
例えば、FLT1が比較的高い重量と複数の異なる因子を有して示されるように見られる。肺癌データセットでBRCA1遺伝子を探索すると、CorEx因子26に最も強く関連する遺伝子が明らかになります。この因子のGO用語濃縮は非常に高く、DNA修復は10倍から負の19の誤検出率を示す。
この選択は、子として6つの密接に関連する要因を持つ第2レベルのクラスター L2_8にも注目を集めています。DNA修復タンパク質相互作用ネットワークは、強力に接続され、因子26における遺伝子の緊密に結合した機能性をさらに支持する。関連する生存グラフは、より大きなデータセットで確認する必要がある患者の生存との関連の可能性を示唆している。
生存評価から始めて、特定の遺伝子発現グループに関連する改善された生存率と相関する因子の解剖を可能にすることができる。各因子にタンパク質相互作用ウィンドウを追加すると、生存との関連について可能な説明の決定が容易になります。各因子のヒートマップをチェックして、遺伝子発現パターンが生物学的解釈をサポートするのに十分な品質であることを確認することが重要です。
遺伝子発現パターンの強く明確な変動を示すヒートマップは、高いから低い、またはより複雑なパターンに及ぶ因子遺伝子の協調発現を示し、発現が低い遺伝子は他の遺伝子と高い発現を有する。この手順の包括的な目標は、潜在的な腫瘍特異的療法を特定するために、サンプル外腫瘍をCorExplorer因子にマッピングすることによってパーソナライズされた治療法を設定することです。