כדי להתחיל, בדף הבית של מחברת Jupyter, לחץ על אופטימיזציה מודל M02-DeepOmicsAE. מחברת IPYNB כדי לפתוח אותה בכרטיסיה חדשה. בתא השני של המחברת, הקלד את שם קובץ הפלט שנוצר בעת עיבוד מראש של נתונים במקום M01_output_data.csv.
בתא החמישי, ציין את מיקומי העמודות עבור סוגי נתונים שונים, כגון נתוני פרוטאומיקה, נתוני מטבולומיקה, נתונים קליניים וכל נתוני הביטוי המולקולרי. החלף col_start ו- col_end במדדי העמודות המתאימים עבור כל סוג נתונים. ציין את שם העמודה הכוללת את משתנה היעד במקום y_column_name כ- y_label.
בתא השישי, הגדר את מספר הסיבובים למיטוב מודל על-ידי הקצאת ערך ל- n_comb. סבבי אופטימיזציה נוספים יעזרו לכוונן את הפרמטרים של המודל ולשפר את ביצועי המודל, אך גם נגדיל את זמן העיבוד. הפעל את המחברת על-ידי בחירה באפשרות תא ולאחר מכן הפעל הכל בשורת התפריטים.
כדי ליישם את זרימת העבודה, לחץ על יישום M03a-DeepOmicsAE עם פרמטרים מותאמים אישית. מחברת ipynb בדף הבית של מחברת Jupyter. בתא השני של המחברת, הקלד את שם קובץ הפלט שנוצר בעת עיבוד מראש של נתונים במקום M01_output_data.csv.
בתא החמישי, ציין את מיקומי העמודות עבור סוגי נתונים שונים, כגון נתוני פרוטאומיקה, נתוני מטבולומיקה, נתונים קליניים וכל נתוני הביטוי המולקולרי. החלף col_start ו- col_end במדדי העמודות המתאימים עבור כל סוג נתונים. ציין את שם העמודה הכוללת את משתנה היעד במקום y_column_name כ- y_label.
בחר תא ואחריו הפעל הכל בשורת התפריטים. חלקות ה- PCA וההפצה של ציוני תכונות חשובים יישמרו באופן אוטומטי בתיקיה המקומית. רשימות של תכונות חשובות עבור כל מודול איתות מזוהה יאוחסנו גם כקבצי טקסט בתיקייה המקומית עם השמות module_n.txt.
כדי ליישם את זרימת העבודה עם פרמטרים מוגדרים מראש, לחץ על יישום M03b-DeepOmicsAE עם פרמטרים מוגדרים מראש. מחברת ipynb בדף הבית של מחברת Jupyter. לאחר מכן בצע את אותו הליך.
שים לב שהפרמטרים kprot, kmet ו- latent בתא השביעי של המחברות מחושבים באופן אוטומטי בתוך הסקריפט בהתבסס על התוצאות של סבבי אופטימיזציה קודמים. פרוטאום, מטבוליזם ונתונים קליניים מ-142 דגימות מוח אנושיות לאחר המוות שמקורן באנשים שהיו בריאים או שאובחנו עם מחלת אלצהיימר נותחו באמצעות זרימת עבודה זו בהתבסס על מודל מקודד אוטומטי של למידה עמוקה לחילוץ קבוצה תמציתית של תכונות מנתוני הקלט הרב-מימדיים הגבוהים. התוצאות מאופטימיזציה של פרמטרי המודל מראות כי בחירת מספר קטן של תכונות פרוטאומיות ומטבוליות שישמשו כקלט למודל מספקת רמה גבוהה יותר של הפרדה בין חולים בריאים לחולי אלצהיימר.
בעוד שלמספר תאי העצב בשכבה הסמויה לא הייתה השפעה משמעותית על ביצועי המודל. באמצעות הפרמטרים האופטימליים, קבוצה קטנה של תכונות המסכמות את נתוני הקלט, הנקראות תכונות מחולצות, חולצו מהשכבה הסמויה של מודל המקודד האוטומטי. ניתוח PCA הראה כי קבוצות האבחון הופרדו על ידי התכונות שחולצו.
עם זאת, הקבוצות לא נבדלו היטב על ידי התכונות המקוריות, מה שמצביע על כך שהתכונות שחולצו לוכדות את המידע החיוני לקביעת מצב המחלה.