Börja med att initiera en ny Jupyter Notebook-session genom att öppna ett nytt terminalfönster och skriva Jupyter Notebook. Tryck sedan på Retur. På startsidan för Jupyter Notebook väljer du anteckningsboken med titeln M01 förbearbetning av uttrycksdata.
ipynb för att öppna den i en ny flik i webbläsaren. Den här notebook-filen normaliserar och skalar indata, hanterar data som saknas och tar bort extremvärden. I den andra cellen i anteckningsboken ersätter du platshållaren your_dataset_name.
csv med det faktiska namnet på datauppsättningsfilen. I den sista cellen i anteckningsboken ersätter du M01_output_data. csv med önskat namn för utdatafilen.
För varje datatyp, till exempel proteomik, metabolomik, kontinuerliga kliniska data och binära kliniska data, använder du kommandot i den fjärde cellen för att bestämma de index som motsvarar den första och sista kolumnen. Kontrollera kolumnnamnen för att hitta kolumnerna som motsvarar proteomikdata, metabolomikdata och kliniska data. Ange kolumnpositionerna för olika datatyper i den femte cellen genom att ersätta col_start och col_end med det första och sista kolumnindexet för varje datatyp.
Välj Cell och sedan Kör alla på menyraden i Jupyter för att skapa utdatafilen i den angivna mappen.