للبدء ، ابدأ جلسة Jupyter Notebook جديدة عن طريق فتح نافذة طرفية جديدة وكتابة Jupyter Notebook. ثم اضغط على Enter. في الصفحة الرئيسية لدفتر ملاحظات Jupyter، حدد دفتر الملاحظات الذي يحمل عنوان المعالجة المسبقة لبيانات تعبير M01.
IPYNB لفتحه في علامة تبويب متصفح جديدة. سيعمل دفتر الملاحظات هذا على تطبيع بيانات الإدخال وتوسيع نطاقها ومعالجة البيانات المفقودة وإزالة القيم المتطرفة. في الخلية الثانية من دفتر الملاحظات، استبدل العنصر النائب your_dataset_name.
CSV بالاسم الفعلي لملف مجموعة البيانات. في الخلية الأخيرة من دفتر الملاحظات، استبدل M01_output_data. CSV بالاسم المفضل لملف بيانات الإخراج.
لكل نوع من أنواع البيانات، مثل البروتينات والأيض والبيانات السريرية المستمرة والبيانات السريرية الثنائية، استخدم الأمر الموجود في الخلية الرابعة لتحديد المؤشرات المقابلة للعمودين الأول والأخير. تحقق من أسماء الأعمدة لتحديد موقع الأعمدة المقابلة لبيانات البروتينات وبيانات الأيض والبيانات السريرية. حدد مواضع الأعمدة لأنواع البيانات المختلفة في الخلية الخامسة عن طريق استبدال col_start و col_end بفهارس العمود الأول والأخير لكل نوع بيانات.
حدد خلية ، ثم تشغيل الكل من شريط القائمة في Jupyter لإنشاء ملف بيانات الإخراج في المجلد المحدد.