まず、新しいターミナル ウィンドウを開き、「Jupyter Notebook」と入力して、新しい Jupyter Notebook セッションを開始します。次に、Enter キーを押します。Jupyter Notebook のホームページで、M01 expression data pre-processing というタイトルのノートブックを選択します。
ipynb をクリックして、新しいブラウザタブで開きます。このノートブックは、入力データの正規化とスケーリング、欠損データの処理、外れ値の削除を行います。ノートブックの 2 番目のセルで、プレースホルダー your_dataset_nameを置き換えます。
CSV をデータセット ファイルの実際の名前に置き換えます。ノートブックの最後のセルで、M01_output_data を置き換えます。csv を出力データファイルの優先名に置き換えます。
プロテオミクス、メタボロミクス、連続臨床データ、バイナリ臨床データなどのデータタイプごとに、4 番目のセルのコマンドを使用して、最初と最後の列に対応するインデックスを決定します。プロテオミクスデータ、メタボロミクスデータ、臨床データに対応するカラムを見つけるには、カラム名を確認してください。col_startと col_end を各データ型の最初と最後の列インデックスに置き換えて、5 番目のセルのさまざまなデータ型の列位置を指定します。
Jupyter のメニュー バーから [セル] を選択し、次に [すべて実行] を選択して、指定したフォルダーに出力データ ファイルを作成します。