מגוון משימות סיווג רצף ביולוגי, כגון סיווג מינים, סיווג תפקודי גנים וסיווג מארח חוטים הם תהליכים צפויים בניתוחי נתונים מטגנומיים רבים. מאז נתונים metagenomic מכילים מספר רב של מינים נובו וגנים, אורגניזמים סיווג ביצועים גבוהים נדרשים במחקרים רבים. ביולוגים נתקלים לעתים קרובות באתגר במציאת כלי סיווג ומיון מתאימים למשימה מסוימת ולעתים קרובות אינם מסוגלים לבנות אורגניזם מקביל בעצמם בגלל היעדר הידע המתמטי והחישובי הדרוש.
טכניקות למידה עמוקה הפכו לאחרונה לנושא פופולרי ומציגות יתרון חזק במשימות סיווג רבות. עד כה, חבילות למידה עמוקה רבות ארוזות מאוד, המאפשרות לביולוגים לבנות מסגרות למידה עמוקה, על פי הצרכים שלהם ללא ידע מעמיק בפרטי האורגניזם פותחו. במדריך זה, אנו מספקים קו מנחה לבניית מסגרת למידה עמוקה קלה לשימוש לסיווג רצף ללא צורך בידע מתמטי מספיק או מיומנויות תכנות.
הווידאו הבא מראה כיצד להשתמש במכונה הווירטואלית כדי לבצע סיווג רצף ביולוגי. משתמשים צריכים להוריד את קובץ המחשב הווירטואלי מדף הבית של ערכת הלימוד ולאחר מכן להוריד את תוכנת VirtualBox. המחשב הווירטואלי נדחס כקובץ שבעים.
ניתן לשחרר בקלות את 70 הקובץ באמצעות תוכנת דחיסה נוכחית, כגון WinRar, Winzip ו- 7-Zip. אנחנו הפחתתנו את הלחץ המכונה הווירטואלית באמצעות 7-Zip. הפחתת הלחץ עשויה להימשך זמן מה.
אנא המתן זמן מה. לאחר ביטול דחיסה משתמשים צריכים להתקין את תוכנת VirtualBox. צור תיקיה להתקנת הקופסה הווירטואלית.
צור חבילת התקנה של VirtualBox. בחר את התיקיה שנוצרה בעצמך. לאחר מכן התקן את תוכנת VirutalBox על-ידי לחיצה על הלחצן הבא בכל שלב.
ההתקנה עשויה להימשך זמן מה, נא המתן זמן מה. פתח את תוכנת VirtualBox. צור לחצן חדש כדי ליצור מחשב וירטואלי.
הזן את שם המחשב הווירטואלי שצוין בעצמך במסגרת השם. בחר Linux כמערכת ההפעלה במסגרת הסוג. בחר Ubuntu במסגרת הגירסה ולחץ על הלחצן הבא.
במידת האפשר, הקצה כמות גדולה יותר של זיכרון למחשב הווירטואלי. True, השימוש בבחירת קובץ דיסק קשיח קיימת. בחר את קובץ המחשב הווירטואלי שהורד מדף הבית של ערכת הלימוד.
ולאחר מכן לחץ על לחצן צור. לחץ על לחצן התחל כדי לפתוח את המחשב הווירטואלי. הפעלת המכונה הווירטואלית עשויה להימשך זמן מה.
אנא המתן רגע לפני השלב הבא. לאחר מכן משתמשים צריכים ליצור תיקיה משותפת הן במחשבים מארחים פיזיים והן במחשב וירטואלי כדי להחליף קבצים. במחשב המארח הפיזי שלך, צור תיקיה משותפת בשם מארח משותף ובשולחן העבודה של המחשב הווירטואלי, צור תיקיה משותפת בשם shared VM.In הסרגל הידני של המחשב הווירטואלי, לחץ על התקנים, תיקיות משותפות, הגדרות תיקיה משותפת ברציפות.
לחץ על הלחצן בפינה השמאלית העליונה. בחר את התיקיה המשותפת במחשב המארח הפיזי שנוצר על-ידי עצמך. בחר באפשרות הטעינה האוטומטית.
לחץ על לחצן אישור. לאחר מכן הפעל מחדש את המחשב הווירטואלי. הפעלה מחדש של המחשב הווירטואלי עשויה להימשך זמן מה.
אנא המתן רגע לפני השלב הבא. לחץ על הלחיצה הימנית על שולחן העבודה של המחשב הווירטואלי ופתח את המסוף. הקלד את הפקודה הבאה במסוף.
סודו, מקש רווח, טעינה, מקש רווח, סרגל T, מקש רווח, vboxsf, מקש רווח, מארח משותף, מקש רווח, קו נטוי נקודה, שולחן עבודה, קו נטוי, VM משותף.כאשר תתבקש להזין סיסמה, הזן אחד והקש על מקש Enter. העתק את כל ארבעת קבצי הרצף בתבנית מהירה יותר עבור תהליך האימון והבדיקה לתיקיית המחשב המארח המשותף של המחשב המארח הפיזי. בדרך זו, כל הקבצים יתרחשו גם בתיקיה VM המשותפת של המחשב הווירטואלי.
לאחר מכן העתק את הקבצים בתיקיית VM המשותפת לתיקיית הלמידה העמוקה של המחשב הווירטואלי. לחץ על הלחיצה הימנית ופתח את המסוף והקלד את הפקודה הבאה כדי לבצע את הקידוד החם היחיד. קו נטוי נקודה, קידוד חם אחד, ציין את הקבצים לאימונים ובדיקות.
וציין את סוג הרצף. לאחר מכן הקלד את הפקודה הבאה כדי להתחיל את תהליך המגמה. מפתח חלל פיתון, נקודה רכבת P Y.Then תהליך המגמה יתחיל.
תהליך זה עשוי להימשך מספר שעות או מספר ימים, בהתאם לגודל ערכת הנתונים שלך. בסיום התהליך, תוצאת החיזוי של נתוני הבדיקה קיימת בקובץ CSV של נקודת החיזוי. בעבודתנו הקודמת, פיתחנו סדרה של כלי סיווג רצף עבור נתונים מטגנומיים, באמצעות גישה דומה למדריך זה.
לדוגמה, פיתחנו כלי שמטרתו לזהות את חלבוני הנגיף הפרוקריוטה המלאים והחלקיים מנתונים רצים. וכלי שמטרתו לזהות שברי דנ"א של פאג' מרסיסי דנ"א כרומוזומים חיידקיים בנתונים מטוגונומיים. הביצועים של הכלים באמצעות התסריט של ערכת לימוד זו מוצגים באיור a ו- b.
לסיכום, מדריך זה מספק סקירה עבור ביולוגים ואורגניזמים לעצב למתחילים על איך לבנות מסגרת למידה עמוקה קלה לשימוש לסיווג רצף ביולוגי בנתונים מטוגונומיים. מדריך זה נועד לספק הבנה אינטואיטיבית של למידה עמוקה ולהתמודד עם האתגר כי למתחילים לעתים קרובות מתקשים להתחיל את חבילת למידה עמוקה וכתיבת הקוד עבור האורגניזם. עבור כמה משימות סיווג פשוטות, משתמשים יכולים להשתמש במסגרת שלנו כדי לבצע את משימת הסיווג.