DiCoExpressは、品質管理から共発現までの完全なアオリスティック分析を提供します。一般化線形モデル内の対比に基づいて微分解析を実行します。また、差次的に発現する遺伝子および共発現遺伝子クラスターのリストに対して濃縮解析を行うこともできる。
DiCoExpressの主な利点は、統計やエアプログラミングの特別な知識がなくても、私のような人々が使用できることです。これは、専門家以外のユーザーが遺伝子発現差解析に必要なコントラストを書くのに本当に役立ちます。また、公開の準備ができている結果を示すグラフィカルな出力も提供します。
DiCoExpressはプラン専用ツールではありません。実験デザインが最大2つの生物学的要因で完全である限り、あらゆる生物に使用できます。さらに、条件間の反復数が等しくない膜の設計も可能です。
初心者はRの予備知識を持っている必要があります関数の使用方法と、必須およびオプションの引数を特定する方法を知っている必要があります。次に、重要なステップは、と実験計画を含むファイルを正しく提供することです。まず、R スタジオ セッションを開きます。
ディレクトリをテンプレートスクリプトに設定し、DiCoExpressチュートリアルドットRスクリプトを開きます。R セッションで DiCoExpress 関数をロードします。次に、R セッションでデータ ファイルを読み込み、ファイル データを簡単に操作できるように、オブジェクト データ ファイルを複数のオブジェクトに分割します。
次に、NB条件またはNB複製の中から戦略を選択し、低発現遺伝子をフィルタリングするための閾値を選択します。グループの色を指定し、正規化方法を選択します。次に、品質管理を実行します。
データが反復係数に従ってペアになっている場合は、状態はtrueとして複製され、それ以外の場合はfalseとして状態になります。交互作用を真として割り当てて、2つの生物学的因子間の交互作用を考慮します。それ以外の場合は false を割り当て、統計モデルを指定して、誤検出率のしきい値を定義します。
差分解析を実行してから、エンリッチメント解析の閾値を固定し、発現差のある遺伝子リストのエンリッチメント解析を実行します。比較するDEGリストを選択します。リスト比較の名前を指定し、出力ファイルが保存されるディレクトリに同じ名前を使用します。
DEGリストに対して実行するアクションを指定するためのパラメータ操作をユニオンまたは交差に設定し、リストを比較します。共発現解析を実施した後、共発現クラスターのエンリッチメント解析を実施します。最後に、分析を再現するために必要なすべての情報を含む2つのログファイルを生成します。
サンプルあたりの正規化された合計カウントは、イントラ条件とインター条件の両方を比較すると類似しているはずです。正規化された遺伝子発現数は、条件内および条件間の両方で同様の中央値と分散を示しました。潜在的な基礎となるデータ構造を特定するために、PCAプロットが生成されました。
治療とクラスタリングの間に明確な区別が観察され、質の高いデータセットが示された。モデリングの品質を評価するために、生のpvalueヒストグラムをプロットしました。生のp値の分布は均一で、予想通り分布の左端にピークがありました。
右端側にピークがないことは、統計モデリングが正しいように見えることを示しています。遺伝子CIG62301.1の発現プロファイルを、すべての遺伝子型および状態において、プロットした。差次的に発現された遺伝子の数ならびに、試験されたすべてのコントラストについてもプロットした。
共発現解析は、5つのDEGリストの和集合に対して行った。対照的に同定され、遺伝子型1または2間の治療応答変動を他の遺伝子型に対して探す。同定されたすべてのクラスターの共発現遺伝子を個々のテキストファイルに印刷し、遺伝子の発現プロファイルをプロットした。
DiCoExpressを使用すると、生物学者は統計的に健全な遺伝子発現分析を得ることができます。次のステップは、これらの結果から生物学的に意味をなすことです。