For å begynne, start en ny Jupyter Notebook-økt ved å åpne et nytt terminalvindu og skrive Jupyter Notebook. Trykk deretter Enter. På hjemmesiden til Jupyter Notebook velger du notatblokken med tittelen M01 expression data pre-processing.
ipynb for å åpne den i en ny nettleserfane. Denne notatblokken normaliserer og skalerer inndataene, håndterer manglende data og fjerner avvik. I den andre cellen i notatblokken erstatter du plassholderen your_dataset_name.
CSV med det faktiske navnet på datasettfilen. I den siste cellen i notatblokken bytter du ut M01_output_data. CSV med det foretrukne navnet for utdatafilen.
For hver datatype, for eksempel proteomikk, metabolomikk, kontinuerlige kliniske data og binære kliniske data, bruk kommandoen i den fjerde cellen for å bestemme indeksene som tilsvarer den første og siste kolonnen. Kontroller kolonnenavnene for å finne kolonnene som tilsvarer proteomikkdata, metabolomikkdata og kliniske data. Angi kolonneposisjonene for forskjellige datatyper i den femte cellen ved å erstatte col_start og col_end med indeksene for første og siste kolonne for hver datatype.
Velg Celle og deretter Kjør alle fra menylinjen i Jupyter for å opprette utdatafilen i den angitte mappen.