Start om te beginnen een nieuwe Jupyter Notebook-sessie door een nieuw terminalvenster te openen en Jupyter Notebook te typen. Druk vervolgens op Enter. Selecteer op de startpagina van Jupyter Notebook het notitieblok met de naam M01-expressiegegevensvoorverwerking.
ipynb om het in een nieuw browsertabblad te openen. Dit notitieblok normaliseert en schaalt de invoergegevens, verwerkt ontbrekende gegevens en verwijdert uitschieters. Vervang in de tweede cel van het notitieblok de tijdelijke aanduiding your_dataset_name.
csv met de werkelijke naam van het gegevenssetbestand. Vervang M01_output_data in de laatste cel van het notitieblok. csv met de voorkeursnaam voor het uitvoergegevensbestand.
Gebruik voor elk gegevenstype, zoals proteomics, metabolomics, continue klinische gegevens en binaire klinische gegevens, de opdracht in de vierde cel om de indices te bepalen die overeenkomen met de eerste en laatste kolom. Controleer de kolomnamen om de kolommen te vinden die overeenkomen met de proteomics-gegevens, metabolomics-gegevens en klinische gegevens. Geef de kolomposities voor verschillende gegevenstypen in de vijfde cel op door col_start en col_end te vervangen door de indexen van de eerste en laatste kolom voor elk gegevenstype.
Selecteer Cel en vervolgens Alles uitvoeren in de menubalk in Jupyter om het uitvoergegevensbestand in de opgegeven map te maken.