Per iniziare, avviare una nuova sessione di Jupyter Notebook aprendo una nuova finestra del terminale e digitando Jupyter Notebook. Quindi premere Invio. Nella home page di Jupyter Notebook selezionare il notebook denominato Pre-elaborazione dei dati delle espressioni M01.
ipynb per aprirlo in una nuova scheda del browser. Questo notebook normalizzerà e ridimensionerà i dati di input, gestirà i dati mancanti e rimuoverà i valori anomali. Nella seconda cella del blocco appunti sostituire il your_dataset_name segnaposto.
csv con il nome effettivo del file del set di dati. Nell'ultima cella del notebook, sostituisci M01_output_data. CSV con il nome preferito per il file di dati di output.
Per ogni tipo di dati, ad esempio proteomica, metabolomica, dati clinici continui e dati clinici binari, utilizzare il comando nella quarta cella per determinare gli indici corrispondenti alla prima e all'ultima colonna. Controllare i nomi delle colonne per individuare le colonne corrispondenti ai dati di proteomica, metabolomica e clinica. Specificare le posizioni delle colonne per i diversi tipi di dati nella quinta cella sostituendo col_start e col_end con gli indici della prima e dell'ultima colonna per ogni tipo di dati.
Selezionare Cella, quindi Esegui tutto dalla barra dei menu in Jupyter per creare il file di dati di output nella cartella specificata.