כדי להתחיל, התחל הפעלה חדשה של Jupyter Notebook על-ידי פתיחת חלון מסוף חדש והקלדת Jupyter Notebook. לאחר מכן הקש Enter. בדף הבית של Jupyter Notebook, בחר את המחברת שכותרתה M01 expression data pre-processing.
IPYNB כדי לפתוח אותו בכרטיסיית דפדפן חדשה. מחברת זו תנרמל ותשנה את קנה המידה של נתוני הקלט, תטפל בנתונים חסרים ותסיר חריגים. בתא השני של המחברת, החלף את מציין המיקום your_dataset_name.
CSV עם השם בפועל של קובץ ערכת הנתונים. בתא האחרון של המחברת, החלף M01_output_data. CSV עם השם המועדף עבור קובץ נתוני הפלט.
עבור כל סוג נתונים, כגון פרוטאומיקה, מטבולומיקה, נתונים קליניים רציפים ונתונים קליניים בינאריים, השתמש בפקודה בתא הרביעי כדי לקבוע את המדדים המתאימים לעמודה הראשונה והאחרונה. בדוק את שמות העמודות כדי לאתר את העמודות המתאימות לנתוני הפרוטאומיקה, נתוני המטבולומיקה והנתונים הקליניים. ציין את מיקומי העמודות עבור סוגי נתונים שונים בתא החמישי על-ידי החלפת col_start ו- col_end במדדי העמודה הראשונה והאחרונה עבור כל סוג נתונים.
בחר Cell ולאחר מכן Run All משורת התפריטים ב- Jupyter כדי ליצור את קובץ נתוני הפלט בתיקייה שצוינה.