शुरू करने के लिए, एक नई टर्मिनल विंडो खोलकर और Jupyter Notebook टाइप करके एक नया Jupyter Notebook सत्र शुरू करें। फिर एंटर दबाएं। ज्यूपिटर नोटबुक होमपेज पर, M01 एक्सप्रेशन डेटा प्री-प्रोसेसिंग शीर्षक वाली नोटबुक का चयन करें।
IPYNB इसे एक नए ब्राउज़र टैब में खोलने के लिए। यह नोटबुक इनपुट डेटा को सामान्य और स्केल करेगी, अनुपलब्ध डेटा को संभालेगी और आउटलायर्स को निकालेगी। नोटबुक के दूसरे कक्ष में, प्लेसहोल्डर your_dataset_name बदलें.
डेटासेट फ़ाइल के वास्तविक नाम के साथ CSV. नोटबुक के अंतिम कक्ष में, M01_output_data बदलें. आउटपुट डेटा फ़ाइल के लिए पसंदीदा नाम के साथ CSV।
प्रत्येक डेटा प्रकार, जैसे प्रोटिओमिक्स, मेटाबोलॉमिक्स, निरंतर नैदानिक डेटा और बाइनरी नैदानिक डेटा के लिए, पहले और अंतिम कॉलम के अनुरूप सूचकांकों को निर्धारित करने के लिए चौथे सेल में कमांड का उपयोग करें। प्रोटिओमिक्स डेटा, मेटाबोलॉमिक्स डेटा और नैदानिक डेटा के अनुरूप कॉलम का पता लगाने के लिए कॉलम नामों की जांच करें। प्रत्येक डेटा प्रकार के लिए प्रथम और अंतिम स्तंभ सूचकांकों के साथ col_start और col_end को प्रतिस्थापित करके पाँचवें कक्ष में विभिन्न डेटा प्रकारों के लिए स्तंभ स्थितियाँ निर्दिष्ट करें.
सेल का चयन करें, फिर निर्दिष्ट फ़ोल्डर में आउटपुट डेटा फ़ाइल बनाने के लिए ज्यूपिटर में मेनू बार से सभी चलाएं।