للبدء ، في الصفحة الرئيسية لدفتر Jupyter ، انقر فوق تحسين نموذج M02-DeepOmicsAE. دفتر ملاحظات IPYNB لفتحه في علامة تبويب جديدة. في الخلية الثانية من دفتر الملاحظات، اكتب اسم ملف الإخراج الذي تم إنشاؤه عند المعالجة المسبقة للبيانات بدلا من M01_output_data.csv.
في الخلية الخامسة، حدد مواضع الأعمدة لأنواع البيانات المختلفة، مثل بيانات البروتينات وبيانات الأيض والبيانات السريرية وجميع بيانات التعبير الجزيئي. استبدل col_start و col_end بفهارس الأعمدة المناسبة لكل نوع من أنواع البيانات. حدد اسم العمود الذي يحتوي على المتغير الهدف بدلا من y_column_name ك y_label.
في الخلية السادسة، حدد عدد الجولات لتحسين النموذج عن طريق تعيين قيمة إلى n_comb. ستساعد المزيد من جولات التحسين في ضبط معلمات النموذج وتحسين أداء النموذج ، لكننا سنزيد أيضا من وقت المعالجة. قم بتنفيذ دفتر الملاحظات عن طريق تحديد خلية ، ثم تشغيل الكل من شريط القوائم.
لتنفيذ سير العمل ، انقر فوق تنفيذ M03a-DeepOmicsAE مع معلمات محسنة مخصصة. دفتر ملاحظات ipynb على الصفحة الرئيسية لدفتر Jupyter. في الخلية الثانية من دفتر الملاحظات، اكتب اسم ملف الإخراج الذي تم إنشاؤه عند المعالجة المسبقة للبيانات بدلا من M01_output_data.csv.
في الخلية الخامسة، حدد مواضع الأعمدة لأنواع البيانات المختلفة، مثل بيانات البروتينات وبيانات الأيض والبيانات السريرية وجميع بيانات التعبير الجزيئي. استبدل col_start و col_end بفهارس الأعمدة المناسبة لكل نوع من أنواع البيانات. حدد اسم العمود الذي يحتوي على المتغير الهدف بدلا من y_column_name ك y_label.
حدد خلية متبوعة بتشغيل الكل من شريط القائمة. سيتم حفظ مخططات PCA وتوزيع درجات الميزات المهمة تلقائيا في المجلد المحلي. سيتم أيضا تخزين قوائم الميزات المهمة لكل وحدة تشوير محددة كملفات نصية في المجلد المحلي مع الأسماء module_n.txt.
لتنفيذ سير العمل باستخدام معلمات محددة مسبقا ، انقر فوق تنفيذ M03b-DeepOmicsAE مع معلمات محددة مسبقا. دفتر ملاحظات ipynb على الصفحة الرئيسية لدفتر Jupyter. ثم اتبع نفس الإجراء.
لاحظ أن المعلمات kprot و kmet والكامنة في الخلية السابعة من دفاتر الملاحظات يتم حسابها تلقائيا داخل البرنامج النصي بناء على نتائج جولات التحسين السابقة. تم تحليل البروتينات والأيض والبيانات السريرية من 142 عينة دماغ بشري بعد الوفاة مشتقة من أفراد كانوا إما أصحاء أو تم تشخيصهم بمرض الزهايمر باستخدام سير العمل هذا بناء على نموذج التشفير التلقائي للتعلم العميق لاستخراج مجموعة موجزة من الميزات من بيانات الإدخال متعددة الأبعاد عالية الأبعاد. تظهر نتائج تحسين معلمات النموذج أن اختيار عدد صغير من ميزات البروتين والتمثيل الغذائي لاستخدامها كمدخلات للنموذج يوفر درجة أعلى من الفصل بين المرضى الأصحاء ومرضى الزهايمر.
في حين أن عدد الخلايا العصبية في الطبقة الكامنة لم يكن له تأثير كبير على أداء النموذج. باستخدام المعلمات المثلى ، تم استخراج مجموعة صغيرة من الميزات التي تلخص بيانات الإدخال ، تسمى الميزات المستخرجة ، من الطبقة الكامنة لنموذج التشفير التلقائي. أظهر تحليل PCA أن مجموعات التشخيص تم فصلها بواسطة الميزات المستخرجة.
ومع ذلك ، لم يتم تمييز المجموعات بشكل جيد من خلال الميزات الأصلية ، مما يشير إلى أن الميزات المستخرجة تلتقط المعلومات الحاسمة لتحديد حالة المرض.