אמצעי זה יכול לסייע לענות על שאלות מפתח בתחום הגילוי הביו-רפואי אודות יצירת פתרונות מרובים. היתרון העיקרי של טכניקה זו הוא שהיא מספקת ממשק משתמש גרפי ידידותי למשתמש לסיוע לחוקרים ביו-רפואיים בזיהוי תכונות מרובות שוככת. התחל בטעינת הנתונים מטריקס ותוויות מחלקה לתוכנה.
לחץ על טען מטריצת נתונים כדי לבחור את קובץ מדדי הנתונים שצוין על-ידי המשתמש וטען תוויות מחלקה כדי לבחור את קובץ תוויות המחלקה המתאים. כדי לקבוע את תוויות המחלקה במספר התכונות המדורגות במקום הראשון, בחר את שמות המחלקות החיוביות ושליליות בתיבות הנפתחות המתאימות ובחר 10 כמספר התכונות המדורגות ביותר בתיבה הנפתחת X העליונה לקבלת מסך מקיף של קבוצת המשנה של התכונה. כדי לכוונן את פרמטרי המערכת עבור ביצועים שונים, בחר את דיוק מדידת הביצועים כתיבה הנפתחת דיוק מאוזן דיוק עבור מסווג מכונת הלמידה הקיצונית שנבחר.
לאחר מכן, בחר ערך ניתוק של 0.7 עבור מדידת הביצועים שצוינה בתיבת הקלט של ניתוק הביצועים. כדי להפעיל את הצבר, לחץ על נתח ובחר 0.7 כערך ברירת המחדל של מדידת הביצועים שנחתכה. בנוסף, 10 כמספר ברירת המחדל של ערכות המשנה של התכונות הטובות ביותר.
לאחר מכן לאסוף ולפרש את התכונות שזוהו על ידי התוכנה. כדי ליצור חלקת פיזור תלת-מימדית של 10 התכונות המובילות של קבוצות המשנה עם ביצועי הסיווג הטובים ביותר שזוהו על-ידי התוכנה, לחץ על נתח ומיין את שלוש התכונות בקבוצה משנית של תכונות בסדר עולה של שורותיהן, תוך שימוש בשורות שלושת התכונות כצירים F1, F2 ו- F3. שנה את ערך החיתוך של הביצועים ל- 0.7 ולחץ על analyze כדי ליצור התוויית פיזור תלת-ממדית של ערכות המשנה של התכונות עם ערך מדידת ביצועים גדול או שווה לביצועים.
לאחר מכן לחצו על 'כוונון תלת-מימדי' כדי לפתוח חלון חדש לכוונון ידני של זוויות התצוגה של התוויית פיזור תלת-מימדית וצמצמו את היתירות של תת-קבוצות התכונות שזוהו. כדי להוסיף ביאורים לגן הן ברמות הדנ"א והן ברמות רצף החלבון, פתח את דף האינטרנט של מסד הנתונים David ולחץ על הקישור להמרת מזהה הגן כדי להזין את מזהי התכונות של תת-ערכת הסמן הביולוגי הראשונה של ערכת הנתונים המוכנה. לחץ על הקישור לרשימת הגנים ולחץ על שלח רשימה כדי לאחזר את הביאורים של עניין, ולהראות רשימת גנים כדי לקבל את הרשימה של סמלי Gene.
לאחר מכן, פתח את דף האינטרנט של מסד הנתונים GeneCards והזן את שם הגן המעניין בתיבת הקלט של שאילתת מסד הנתונים כדי למצוא את הביאורים של גן זה. פתח את הירושה המקוונת מנדליאנית באדם וחפש את הגן כדי למצוא את הביאורים של גן זה מתוך מסד הנתונים. כדי להוסיף ביאורים לחלבונים המקודדים, פתח את דף מסד הנתונים של מאגר הידע UniProt וחפש את הביאורים של הגן ממסד נתונים זה.
פתח את מערכת החיזוי מבוססת הקבוצה, או שרת האינטרנט GPS, ולאחזר את רצף החלבון מקודד על ידי הגן סמן ביולוגי מתוך מסד הנתונים של מאגר הידע UniProt ולהשתמש בכלי ה-GPS המקוון כדי לחזות את החלבונים לאחר שינוי המעבר שאריות. כדי לבאר את אינטראקציות החלבון-חלבון ושם מועשר מודולים פונקציונליים, לפתוח את דף שרת האינטרנט מחרוזת ולהשתמש במסד הנתונים מחרוזת לחפש את המעלית עבור הגנים של עניין למצוא את המאפיינים המתוזמרים שלהם. כדי לייצא את ערכות המשנה של סמנים ביולוגיים שזוהו לניתוח נוסף, לחץ על יצא את הטבלה ובחר את תבנית הטקסט המתאימה לשמירת הקבצים.
לאחר מכן, יצא את התוויות הפריטים החזותיים כקבצי תמונה בודדים, לחץ על שמור תחת כל התוויה ובחר את תבנית התמונה המתאימה לשמירת כל קובץ. בניסוי מייצג זה, שתי ערכות נתונים זוהו כקבצי CSV ונטענו לתוכנה כפי שהוכח. ערכת הנתונים הראשונה, 128 דגימות עם 12, 625 תכונות ותוויות מחלקה בודדות נטענו עם מטריצת הנתונים הסופית המכילה 95 דגימות שליליות ו -33 דגימות חיוביות.
פעולות דומות בוצעו גם עבור ערכת הנתונים הקשה השנייה. חיפוש מילת מפתח ספציפית למשתמש בשמות התכונות חושף היסטוגרמה של התכונות עבור כל ערכת נתונים. לאחר ביצוע אלגוריתם הצינור עבור כל ערכת נתונים, זוהו 120 ערכות משנה מוסמכות של סמנים ביולוגיים עבור ערכת הנתונים הקלה להפלות, כאשר 57 תת-ערכות משנה של סמנים ביולוגיים שלישייה הפגינו דיוק של 100%.
עם זאת, רק 76 ערכות משנה של סמנים ביולוגיים שבהן זוהו עבור ערכת הנתונים הקשה. ועם דיוק נמוך יותר של תת-ערכות סמנים ביולוגיים המצביע על כך סמנים ביולוגיים הם ספציפיים לפנוטיפים, אתגר מרכזי נוסף בזיהוי סמנים ביולוגיים. בעת שימוש בהליך זה, חשוב לזכור שלבעיית בחירה עתידית יש פתרונות מרובים.
קרא את ביצועי ה-SIM בצורה הטובה ביותר. לאחר התפתחותה, טכניקה זו סללה את הדרך לחוקרים ביו-רפואיים לחקור גילוי ביו-רפואי עם פתרונות מרובים.