モデルパラメーターの最適化と DeepOmicsAE ワークフローの実装

Please note that all translations are AI generated. Click here for the English version.

43 Views

•

04:04 min

•

December 15th, 2023

DOI :

10.3791/201017-v

December 15th, 2023

•

Elena Panizza¹

¹Department of Molecular Medicine, Cornell University

Transcript

まず、Jupyter Notebook のホームページで、M02-DeepOmicsAE モデルの最適化をクリックします。ipynb notebook をクリックして新しいタブで開きます。ノートブックの 2 番目のセルに、データの前処理時に生成される出力ファイルの名前を M01_output_data.csv の代わりに入力します。

5番目のセルでは、プロテオミクスデータ、メタボロミクスデータ、臨床データ、すべての分子発現データなど、さまざまなデータタイプの列位置を指定します。col_start と col_end を、各データ型の適切な列インデックスに置き換えます。y_column_nameの代わりに、ターゲット変数を含む列の名前を y_label として指定します。

6 番目のセルで、n_comb に値を割り当てて、モデル最適化のラウンド数を定義します。最適化ラウンドを増やすと、モデルパラメーターの微調整とモデルのパフォーマンスの向上に役立ちますが、処理時間も長くなります。ノートブックを実行するには、メニューバーから [セル] を選択し、 [すべて実行] を選択します。

ワークフローを実装するには、カスタム最適化パラメータを持つM03a-DeepOmicsAE実装をクリックします。ipynb notebook を Jupyter Notebook ホームページに表示します。ノートブックの 2 番目のセルに、データの前処理時に生成される出力ファイルの名前を M01_output_data.csv の代わりに入力します。

メニューバーから「セル」を選択し、「すべて実行」を選択します。PCAプロットと重要な特徴量スコアの分布は、自動的にローカルフォルダに保存されます。識別された各シグナリングモジュールの重要な機能のリストも、module_n.txt名前のローカルフォルダにテキストファイルとして保存されます。

プリセットパラメータを使用してワークフローを実装するには、プリセットパラメータを使用してM03b-DeepOmicsAEインプリメンテーションをクリックします。ipynb notebook を Jupyter Notebook ホームページに表示します。その後、同じ手順に従います。

ノートブックの 7 番目のセルのパラメーター kprot、kmet、latent は、以前の最適化ラウンドの結果に基づいてスクリプト内で自動的に計算されることに注意してください。このワークフローでは、健常者またはアルツハイマー病と診断された人から得られた142のヒト死後脳サンプルのプロテオーム、メタボローム、および臨床データを、深層学習オートエンコーダーモデルに基づいて解析し、高次元マルチオミクス入力データから簡潔な特徴セットを抽出しました。モデルパラメータ最適化の結果は、モデルの入力として使用される少数のプロテオミクスおよびメタボロミクスの特徴を選択することで、健康な患者とアルツハイマー病患者をより高度に分離できることを示しています。

一方、潜在層のニューロンの数は、モデルのパフォーマンスに大きな影響を与えませんでした。最適なパラメーターを使用して、抽出された特徴と呼ばれる入力データを要約する小さな特徴セットが、オートエンコーダーモデルの潜在層から抽出されました。PCA分析では、抽出された特徴量によって診断群が分離されていることが示されました。

しかし、これらのグループは元の特徴によって十分に区別されておらず、抽出された特徴が病態を決定するために重要な情報を捉えていることが示されました。

Explore More Videos

JoVE

From the series

深層学習によるアルツハイマー病におけるシグナル伝達モジュールの解析

モデル パラメーターの最適化と DeepOmicsAE ワークフローの実装

モデルパラメーターの最適化と DeepOmicsAE ワークフローの実装