まず、Jupyter Notebook のホームページで、M02-DeepOmicsAE モデルの最適化をクリックします。ipynb notebook をクリックして新しいタブで開きます。ノートブックの 2 番目のセルに、データの前処理時に生成される出力ファイルの名前を M01_output_data.csv の代わりに入力します。
5番目のセルでは、プロテオミクスデータ、メタボロミクスデータ、臨床データ、すべての分子発現データなど、さまざまなデータタイプの列位置を指定します。col_start と col_end を、各データ型の適切な列インデックスに置き換えます。y_column_nameの代わりに、ターゲット変数を含む列の名前を y_label として指定します。
6 番目のセルで、n_comb に値を割り当てて、モデル最適化のラウンド数を定義します。最適化ラウンドを増やすと、モデル パラメーターの微調整とモデルのパフォーマンスの向上に役立ちますが、処理時間も長くなります。ノートブックを実行するには、メニュー バーから [セル] を選択し、 [すべて実行] を選択します。
ワークフローを実装するには、カスタム最適化パラメータを持つM03a-DeepOmicsAE実装をクリックします。ipynb notebook を Jupyter Notebook ホームページに表示します。ノートブックの 2 番目のセルに、データの前処理時に生成される出力ファイルの名前を M01_output_data.csv の代わりに入力します。
5番目のセルでは、プロテオミクスデータ、メタボロミクスデータ、臨床データ、すべての分子発現データなど、さまざまなデータタイプの列位置を指定します。col_start と col_end を、各データ型の適切な列インデックスに置き換えます。y_column_nameの代わりに、ターゲット変数を含む列の名前を y_label として指定します。
メニューバーから「セル」を選択し、「すべて実行」を選択します。PCAプロットと重要な特徴量スコアの分布は、自動的にローカルフォルダに保存されます。識別された各シグナリングモジュールの重要な機能のリストも、module_n.txt名前のローカルフォルダにテキストファイルとして保存されます。
プリセットパラメータを使用してワークフローを実装するには、プリセットパラメータを使用してM03b-DeepOmicsAEインプリメンテーションをクリックします。ipynb notebook を Jupyter Notebook ホームページに表示します。その後、同じ手順に従います。
ノートブックの 7 番目のセルのパラメーター kprot、kmet、latent は、以前の最適化ラウンドの結果に基づいてスクリプト内で自動的に計算されることに注意してください。このワークフローでは、健常者またはアルツハイマー病と診断された人から得られた142のヒト死後脳サンプルのプロテオーム、メタボローム、および臨床データを、深層学習オートエンコーダーモデルに基づいて解析し、高次元マルチオミクス入力データから簡潔な特徴セットを抽出しました。モデルパラメータ最適化の結果は、モデルの入力として使用される少数のプロテオミクスおよびメタボロミクスの特徴を選択することで、健康な患者とアルツハイマー病患者をより高度に分離できることを示しています。
一方、潜在層のニューロンの数は、モデルのパフォーマンスに大きな影響を与えませんでした。最適なパラメーターを使用して、抽出された特徴と呼ばれる入力データを要約する小さな特徴セットが、オートエンコーダー モデルの潜在層から抽出されました。PCA分析では、抽出された特徴量によって診断群が分離されていることが示されました。
しかし、これらのグループは元の特徴によって十分に区別されておらず、抽出された特徴が病態を決定するために重要な情報を捉えていることが示されました。