Pour commencer, lancez une nouvelle session Jupyter Notebook en ouvrant une nouvelle fenêtre de terminal et en tapant Jupyter Notebook. Appuyez ensuite sur Entrée. Sur la page d’accueil de Jupyter Notebook, sélectionnez le bloc-notes intitulé Prétraitement des données d’expression M01.
ipynb pour l’ouvrir dans un nouvel onglet du navigateur. Ce bloc-notes normalise et met à l’échelle les données d’entrée, gère les données manquantes et supprime les valeurs aberrantes. Dans la deuxième cellule du bloc-notes, remplacez l’espace réservé your_dataset_name.
CSV avec le nom réel du fichier de jeu de données. Dans la dernière cellule du bloc-notes, remplacez M01_output_data. CSV avec le nom préféré pour le fichier de données de sortie.
Pour chaque type de données, tel que la protéomique, la métabolomique, les données cliniques continues et les données cliniques binaires, utilisez la commande dans la quatrième cellule pour déterminer les indices correspondant à la première et à la dernière colonne. Vérifiez les noms des colonnes pour localiser les colonnes correspondant aux données protéomiques, aux données métabolomiques et aux données cliniques. Spécifiez les positions des colonnes pour les différents types de données dans la cinquième cellule en remplaçant col_start et col_end par les index de la première et de la dernière colonne pour chaque type de données.
Sélectionnez Cellule, puis Exécuter tout dans la barre de menus de Jupyter pour créer le fichier de données de sortie dans le dossier spécifié.