Method Article
פילוח נתונים תלת-ממדיים של טכניקות הדמיה רבות הוא שמכבידות בניתוח של מערכות ביולוגיות מורכבות. כאן, אנו מתארים את השימוש SuRVoS עבודה, שעליו מונחים באופן אוטומטי למחצה קטע נתונים נפחי-אורך-סולמות שונים באמצעות דוגמה datasets מ טומוגרפיה הקפאה אלקטרונים, הקפאה רך רנטגן טומוגרפיה וטכניקות שלב ניגודיות רנטגן טומוגרפיה.
פילוח הוא התהליך של לבודד אזורים ספציפיים או אובייקטים בתוך אמצעי הדמיה, כך ניתן לבצעם מחקר נוסף על אלו תחומי עניין. כאשר שוקלים הניתוח של מערכות ביולוגיות מורכבות, פילוח של נתוני תמונה תלת-ממדית היא צעד אינטנסיבית זמן רב ודיני. עם הזמינות מוגברת של שיטות הדמיה רבים ועם ערכות איסוף נתונים אוטומטיים, זה מהווה אתגר מוגברת של הביולוג ניסיוני מודרניים להעביר נתונים אל הידע. פרסום זה מתאר את השימוש SuRVoS עבודה, שעליו מונחים, תוכנית המיועדת לטיפול בבעיות אלה על-ידי מתן שיטות באופן אוטומטי למחצה קטע ביולוגי נפחי נתונים מורכבים. שלושה נתונים (datasets) שונות ההגדלה ואת שיטות הדמיה מוצגים כאן, כל סימון אסטרטגיות שונות של הממיין עם SuRVoS. שלב ניגודיות רנטגן טומוגרפיה (microCT) של הגוף fruiting של צמח משמש כדי להדגים באמצעות מודל אימון, הקפאה אלקטרון טומוגרפיה (cryoET) של טסיות האנושי משמש כדי להדגים באמצעות סופר - megavoxels, ואת הקפאה רך רנטגן טומוגרפיה ממוחשבת (cryoSXT) של קו בתרבית של תאים משמש כדי להדגים את התווית פיצול כלים. אסטרטגיות ופרמטרים עבור כל סוג נתונים מוצגים גם. על ידי מיזוג מבחר של תהליכים אוטומטיים למחצה לתוך כלי אינטראקטיבי אחד, SuRVoS מספקת מספר יתרונות. באופן כללי הזמן קטע נפחי נתונים מוקטן פי חמש בהשוואה פילוח ידנית, עמוד התווך בתחומים רבים של עיבוד תמונה. זה חסכון משמעותי כאשר פילוח ידנית מלאה יכול לקחת שבועות של מאמץ. בנוסף, הסובייקטיביות מופנית באמצעות גבולות שהמפתחות מזוהה ואוספי פיצול מורכבים של אובייקטים לפי תכונותיהם מחושב ולא על בסיס מקרה לגופו.
SuRVoS עבודה, שעליו מונחים הוא פיסת תוכנה שנועדה לאפשר לחוקרים לחלץ מידע רלוונטי מבחינה מדעית של נפחי נתונים מדגמים שונים, ללא קשר למבנה של הריבית, רזולוציה או הדמיה מודאליות1, 2. נפחי נתונים כגון אלה נאספים לעתים קרובות באמצעות מערכות טומוגרפיית קרני רנטגן או אלקטרונים, באופן שגרתי מבוסס מעבדות בכללותו או מתקנים מרכזי עקב המורכבות שלהם. הן של שיטות אלה, ואת אחרים טכניקות, התוצרת גדולים, מידע עשיר datasets אשר להוכיח מאתגר פלח בשיטות או חצי-אוטומטי או ידני. במיוחד, קרובה לשפת אם המדינה הקפאה. מרותק למיטה datasets דורשים תנאים הדמיה במינון נמוך, וכתוצאה מכך יחס אות לרעש נמוך והניגודיות המסכן, במיוחד של הקפאה אלקטרון טומוגרפיה (cryoET)3,4,5 . גורם נוסף כמה datasets תלת-ממד היא הנוכחות של ממצאים שהוצגו על ידי התנאים ניסיוני ומאתגר מעורבים, לדוגמה חסרים חפצים טריז עקב איסוף נתונים על מוגבל הטיה טווח, וכתוצאה מכך מידע חסר, התארכות בכיוון של קרן3,4,5. אפילו כאשר נמוך אות לרעש או חסרים חפצים טריז אינם בעייתיים (למשל ממוקדת קרן יון SEM6 או בלוק טורי פנים SEM7), המורכבות ואת הטבע תלת מימדי של המדגם, וכן כמות גדולה של נתונים להיות ניתוח עדיין ליהנות תהליך אוטומטי עבור פילוח נתונים.
כיום, כאשר בוחנים כרכים הביולוגי של תאים, ישנן אפשרויות רבות לזיהוי אוטומטי או חצי-אוטומטית תכונות הסלולר מאוד ספציפי, כגון אקטין, microtubules או קומפלקסים חלבון ספציפי, באמצעות חיפוש המבוסס על התבנית, או זיהוי תכונות בסוגים מסוימים של נתונים (datasets) (למשל חדות גבוהה, צבעונית, דגימות שרף-מוטבע)8,9,10,11,12. עם זאת, באלה המקרים א-פריורי מידע או מדגם ספציפי הכנת פרוטוקולים נחוצים, הגבלת תחולת אסטרטגיות אלו מקטעי רחבה. יש גם כלים זמינים לביצוע מודל אימון ברמת voxel כדי ללמוד את המראה של מבנים שונים של עניין כשנותנים קלט משתמש13. עם זאת, ברמה זו המורכבות של הדרכה ובדיקות הדגמים ניתן לשגיאות שהמפתחות יקר. בהינתן התנאים תמונה מאתגרת, והיעדר אסטרטגיות פילוח בהרחבה ישימים, חצי אוטומטי, ידני פילוח מצוי, גם בעבודה עם חומרים ביולוגיים מורכבים14,15, 16 , 17. עם זאת, בדרך כלל מקובל כי התהליך של פילוח ידני אינה רק זמן רב, אך גם לשגיאות סובייקטיבית, המשתנה4,5,18,19 ,20. חלק מהתוכניות פילוח מציעות כלים כדי להקל על התהליך פילוח ידנית (קרי אינטרפולציה, לאסו או מכה כלי)21,22, עם זאת, במקרים של datasets רועש, הם קשים ליישם בהצלחה, ו אפילו כאשר הם משמשים בהצלחה, התהליך הוא עדיין סובייקטיבי ומשתנה.
באופן מסורתי, segmentations היו בשימוש בשתי דרכים נפרדות: איכותית או באופן כמותי. כפי טכנולוגיות הדמיה ואסטרטגיות פילוח לשפר, זה הפך נפוץ יותר לשימוש פילוח ככלי כמותי כדי לענות על השאלות הביולוגיות, כמו "אמת הקרקע" עבור אלגוריתם פיתוח8,12, 15,23,24,25. כדי לעשות זאת, מפורט איזונים ובלמים נדרשים כדי להקטין את השתנות, הסובייקטיביות לאורך כל תהליך26. עם זאת, הזהירות נוספת להגדיל פילוח אופי גוזלת זמן. לכן, חיוני לספק אסטרטגיה מהיר יותר, פחות משתנה פילוח.
SuRVoS עבודה, שעליו מונחים מתחיל לטפל בסוגיות אלה על ידי מתן המשתמש עם מבחר של למידה ממוחשבת, עיבוד כלי המסייע המשתמש בתהליך פילוח, תוך כדי גם מדריך למשתמש דרך השלבים הנדרשים תמונה. כדי להשיג זאת, שני החידושים העיקריים מיושמים יחד ב- SuRVoS. ראשית, היא משתמשת היררכיה אזור סופר לקבוצה דומה, באזורים הסמוכים של הנתונים בהתבסס על מאפייניהם הטבועה. כל אחד האזורים בהיררכיית מייצג באותו אמצעי אחסון באמצעות אלמנטים פחות, תוך כדי מתן גבול חזק להתמדה. לפיכך, סופר-אזורים להפחית את המורכבות של הממיין אמצעי אחסון על-ידי במספר סדרי גודל, עדיין עדיין מייצג את הנתונים ללא אובדן משמעותי של מידע27. שנית, SuRVoS מספקת אסטרטגיה אוטומטית למחצה פילוח המשתמשת תשומות פילוח ידנית מינימלית לאמן מסווגים, אשר משמשות קטע28,אמצעי האחסון הנותרת29. אסטרטגיה זו מפחיתה את פילוח ידנית, במידה רבה להקטין את כמות הזמן משתמש הממיין ומסירה, בעת שימוש אזורים סופר, ידני תיחום הגבולות, הפחתת פוטנציאל ההשתנות הסובייקטיביות.
נוספים התכונות המרכזיות של SuRVoS הוא כלי ספליטר תווית, לפיה משתמש ניתן לסווג סדרה של אובייקטים שכבר ומחולקת על סמך מאפייניהם הטבועה. לאחר פילוח של אובייקטים שונים, עניין, כלי זה יכול לשמש כדי לחלק את ערכת מחלקות בהתבסס על אמצעים כגון עוצמת אובייקט ממוצע, שונות, גודל, מיקום, וכו ' זו שימושית כאשר סיווג קבוצות גדולות של עצמים בעזרת המורכבות גבוהה. לדוגמה, קבוצה של organelles הסלולר ניתן לחלק את המיטוכונדריה, שלפוחית ריקה, טיפות השומנים, וכו '.; או סט של החומר ניתן להפריד תכלילים בהתבסס על גודל או צורה. ברגע מקוטע התוויות בודדים יכול להיות פיצול לקבוצות באמצעות מספר כלשהו של מסווגים, הפחתת זיהוי הטיה.
SuRVoS עבודה, שעליו מונחים בהצלחה שימש קטע נתונים של מספר טכניקות הדמיה. . הנה, סינכרוטרון רנטגן שלב ניגודיות טומוגרפיה (microCT) של הגוף fruiting של צמח משמש כדי להדגים segmentatiבאמצעות מודל אימון, הקפאה אלקטרון טומוגרפיה (cryoET) של טסיות האנושי משמש כדי להדגים באמצעות סופר - ו megavoxels, ומשמשת הקפאה רך רנטגן טומוגרפיה ממוחשבת (cryoSXT) של קו בתרבית של תאים כדי להדגים את התווית פיצול כלים
הערה: בדרך כלל שימושי טווחים של פרמטרים עבור כל שלב העיבוד ואת הפרמטרים ספציפיות עבור כל סוג נתונים המוצגים כאן הינם מסופקים בכל טבלה 1-
1-הכנת סביבת העבודה ונתונים טעינת
2. Preprocessing וייצוג נתונים
3. יצירת אזורים סופר המתאים
4. מבוא ביאור
5. פילוח באמצעות מודל ההכשרה הפגינו עם microCT dataset.
הערה: פילוח הראשון עבור datasets רבים היא להבדיל בין אזורים מרובים גדול אחד מהשני. לדוגמה, הפרדת הגרעין הציטופלסמה, או התא מהמבנה החיצוני קרח ותמיכה. עבור סוג זה של פילוח, עם גבולות מוגדרים היטב ברורים ואזורים גדולים, מודל אימון זה שימושי. כדי להדגים את זה, ייעשה שימוש רנטגן שלב ניגודיות נתונים טומוגרפי של Goosegrass.
6. באמצעות אזורים סופר, הפגינו עם CryoET Dataset.
הערה: פילוח סופר-אזור מאז הוא שימושי עבור אזורים קטנים יותר בצינעה מאוגד, כאן המוקד יהיה על פילוח של organelles ושל microtubules בתוך זה הנתונים (dataset). מודל ההדרכה שימשה מהר קטע של טסיות מן הרקע קרח ו פחם; פרמטרים אלה הם לא נדון עוד, אבל מוצגים בטבלה 1-
7. סיווג, ניתוח של נתונים אובייקטים בהתבסס על מאפייני הטבועה, הפגינו עם CryoSXT Dataset
הערה: בדרך כלל, השלב הבא לאחר פילוח הוא ניתוח של הנתונים. הכלי ספליטר תווית ב- SuRVoS מאפשר הסיווג של אובייקטים מקוטע באמצעות כללים שמבוססים על מאפיינים מהותיים של האובייקטים כגון אובייקט ממוצע עוצמת, סטיה, אמצעי האחסון או מיקום. בכלי הסטטיסטיקה תווית מאפשר הפריט החזותי של קשרי הגומלין בין צעדים אלה עבור כל סוג אובייקט חדש. אלה הם כלים חדשים ובעלי עוצמה לניתוח של מורכבות datasets 3D לאחר פילוח.
8. ייצוא נתונים, Segmentations
שלושה אמצעי אחסון נתונים (datasets) שנאספו מתוך שלוש טכניקות שונות (microCT, cryoET ו cryoSXT) שימשו כדי להדגים את שלוש התכונות החשובות של SuRVoS עבודה, שעליו מונחים: מודל אימון, פילוח אזור סופר ופיצול תווית. Datasets מייצגים קבוצה מגוונת של תוצאות הניסוי, עבור כל אחד מהם מלא עיבוד פרמטרים ניתנים (טבלה 1).
כדי להדגים מודל אימון באמצעות SuRVoS עבודה, שעליו מונחים, dataset ניגודיות גבוהה יחסית עם אזור הגדרת גבולות נבחרה. זה הנתונים (dataset) של הפרי של דבקה aparine, או goosegrass, נאסף באמצעות קרני רנטגן טומוגרפיה ניגודיות שלב I13-2 יהלום-מנצ'סטר הדמיה הפרעות לקרן החלקיקים מקור אור יהלום, צ'ילטון, אוקספורדשייר, בריטניה. המדגם טריים הוצגה באוויר על גבי מד זווית הבסיס על גבי הבמה סיבוב, ממרחק הגלאי מדגם של 30 מ מ. חשיפה פעמים היו 0.10 s עם הקשת קרן ורוד הכולל של אנרגיה רעה של בסביבות 22 קוו. תחזיות נאספו באמצעות 180° עם גודל צעד של 0.1 מעלות. שחזורים טומוגרפי בוצעו באמצעות Savu30,31 עם המסנן ' Paganin ' ' ניגוד ' שלב המבוסס על הפצת תמונות32 ולאחריו הקרנה אחורי מסוננים שיקום toolkit אסטרה33 , 34. נתונים אלה ואז שמקצצים אותי עם 2 x 2 x 2 binning כדי להקטין את גודל הקובץ לפני קלט לתוך SuRVoS עבודה, שעליו מונחים.
ראשית, נתוני הקלט (איור 3A) היה מסונן, כשכרטיס (כדי להסיר את ערכי העוצמה העליון והתחתון בנתונים) (איור 3B). בדרך זו, רקע וקידמה נעשו יותר בקלות ניתן להבחנה, המרקם של המבנה הפנימי של הפרי שהודגשה עוד יותר. בשלב הבא, supervoxels נבנו על גבי ערכת הנתונים מסוננים (איור 3C). כדי להעריך את איכות supervoxels, הם הוצגו ללא הנתונים כדי לוודא פרטים רלבנטיים של ערכת הנתונים היו מיוצגים היטב על ידי supervoxels (דמות תלת-ממד). ביאורים הבא, ידנית באמצעות supervoxels נמסרו כנתונים הדרכה על שלוש פרוסות של אמצעי האחסון (איור 3E, צבעים כהים). נתונים אלה הכשרה הספיק לאמן את המסווג לחזות (צבעים בהירים) האזורים המתאימים רקע (ירוק), פירות זיפים (אדום), זרע חומר (סגול), המקיפים את הבשר (כחול). ליטושים מורפולוגיות שימשו כדי לנקות את segmentations על ידי סתימת חורים, גדל או מתכווץ ככל הדרוש (איור 3F). הזמן הכולל בילה כדי לקבוע פרמטרים מתאימים לחלק את הנתונים (dataset) היה 2 h.
כדי להדגים פילוח סופר-אזור שימוש SuRVoS עבודה, שעליו מונחים, dataset רועש ומסובך נבחר15. Dataset הזה נאסף באמצעות cryoET במרכז הלאומי הדמיה Macromolecular מכללת ביילור לרפואה, יוסטון, TX, ארצות הברית. בקצרה, טסיות דם היו מים עמוקים קפוא על זוהר משוחררים ורשתות TEM פחמן חור fiducial שטופלו זהב. סדרת הטיה נאספו מ- ° ±65 עם תוספת 2 מעלות. הסדרה הטיה שוחזר לאחר מכן באמצעות הקרנה אחורי משוקלל IMOD35.
לאחר טעינת הנתונים לתוך SuRVoS (איור 4A), אזור עניין נבחר, הוחלה ערכת הסינון המתאימה. במקרה זה, מסנן לפי עקומת גאוס החלקת ואחריו וריאציה הכולל מסנן עם הניגוד כשכרטיס נעשה שימוש כדי להדגיש את קצוות ומרקמים של הנתונים (איור 4B). בשלב הבא, מודל אימון עם קלט משתמש מבוסס supervoxel מינימלי שימשה לפלח את טסיות מן הרקע קרח פחמן. לאחר מכן, פילוח למחצה ידנית עם megavoxels ו- supervoxels שימש כדי לחלק את organelles. לבסוף, הפרמטר מקור supervoxel שונה מסנן denoising חלשים ולא supervoxel צורה קטנים יותר (ראה טבלה 1) על מנת לשמר טוב יותר את גבולות microtubules עבור פילוח (איור 4C). גם את organelles וגם את microtubules, שימשו ביאורים ידני מהיר בכל 5-10 פרוסות כדי לבחור את supervoxels המתארים את התכונה של עניין (איור 4D & 4E). הזמן הכולל בילה לקבוע פרמטרים מתאימים, פילוח האזור עניין הציג היה 6-אייץ '.
כדי להדגים תווית פיצול באמצעות SuRVoS עבודה, שעליו מונחים, נבחר dataset עם organelles רבים, מגוונים. Dataset הזה נאסף באמצעות cryoSXT על הפרעות לקרן החלקיקים B24 יהלום אור במקור, צ'ילטון, אוקספורדשייר, בריטניה36. בקצרה, תאים HEK293 גדלו על רשתות finder זהב, fiducials זהב בגודל מתאים נוספו, הרשת בעזרת EM עם הגב-צדדית סופג מים עמוקים. סדרת הטיה ואז נאספו על מיקרוסקופ מ- ° ±65 עם תוספת 0.5°. הסדרה הטיה שוחזר לאחר מכן באמצעות הקרנה אחורי משוקלל IMOD35.
לאחר טעינת הנתונים לתוך SuRVoS (איור 5A), אזור עניין נבחר, במסנן המתאים וריאציה הכולל שימש כדי לשפר את גבולות organelles בכל נפח (איור 5B). בשלב הבא, organelles היו למחצה manually מקוטע באמצעות megavoxels ו- supervoxels ולאחר מכן מעודן עם מילוי חורים, סגירה, התארכות להחלקת הקצוות (איור 5C). הזמן הכולל כדי לקבוע פרמטרים מתאימים לחלק את האזור עניין הציג היה 4 שעות. ברגע פילוח גובשה, המפצל תווית שימש כדי להמחיש כל אברון כאובייקט את ערכת הנתונים (איור 5D), מאפיינים שונים על כל אחד מהאובייקטים בעלילה נתונים (איור 5E). הממשק תווית הפיצול היא אינטראקטיבית, מעדכן את הצבע המשויך בכל כיתה תווית חדשה הפריט החזותי והן העלילה נתונים. דבר זה מאפשר היצירה של כללים שונים המבוססים על המאפיינים הטמונה הנתונים יכול לשמש כדי להפריד את האובייקטים למחלקות שימושי (איור 5F).
איור 1. הפריסה ואת תכונות כלליות של SuRVoS עבודה, שעליו מונחים.
הממשק GUI הוא בצד השמאל, בעוד חלונית הפריטים החזותיים נמצא בצד הימין. אלה שני אזורים מופרדים לפי עמודה של כלים, קיצורי דרך. GUI מסודר ללכת למשתמש דרך המדרגות הראשי preprocessing הנתונים, בחירת פרמטרים supervoxel ו/או megavoxel, הממיין את הנתונים, ואם הצורך באמצעות מודל אימון, לפני ייצוא של segmentations. חלונית הפריטים החזותיים ניתן להשתמש בשלושה מצבים: החזותיים הבסיסיים ואת פילוח לשם הצגת הנתוניםואת כל החלת מסננים כדי לחלק את הנתונים, תווית ספליטר לסווג עצמים לתוך תוויות חדש המבוסס על היבטים הטמון בנתונים, סוף סוף תווית נתונים סטטיסטיים כדי למדוד ותנסו לדמיין את מאפייני האובייקטים מקוטע. לכל המצבים הללו, התפריט הנפתח בפינה העליונה השאירו פינה פקדים הנתונים מוצג, המחוון בחלק העליון שולט ציר z. קיצורי הדרך של הכלי מספק גישה קלה שליטה על ניגוד, השקיפות של שכבות, התקרבות, גלילה לצדדים, לשוב "הביתה" חלונית ויזואליזציה ולאחר פתיחת כלי ביאור כמפורט בפרוטוקול. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.
באיור 2. אזור סופר הירארכיה מפחיתה את המורכבות של סגמנטציה.
תמונה ברקלי פילוח הנתונים (dataset) (BSDS50037) נעשה שימוש כדי להדגים את המאפיינים ואת ההשפעות של סופר-אזורים. התמונה המקורית (משמאל) מורכב אלפי voxels, אשר נאספים ואז מחולקים סמוכים, דומה ליצירת כמה מאות supervoxels (מרכז). Supervoxels יכול להיות התקבץ מחולקים סמוכים, דומה ליצירת כמה עשרות megavoxels (מימין). עם כל קיבוץ, למורכבות המשימה פילוח ירידה עבור משאבים חישובית וידני. חשוב, דוגמה 2D מוצג כאן, עם זאת, הן supervoxels והן megavoxels תלת-ממד. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.
איור 3. עיבוד של microCT הנתונים (dataset) באמצעות מודל אימון פילוח אסטרטגיה.
א פרוסה 2D יחיד של הנתונים הגולמיים. B. החלת מסנן וריאציה הכולל בחוזקה על הנתונים הגולמיים משופרת הגבולות בין ההיבטים השונים של הגוף fruiting. ג. פרמטרים supervoxel המתאימות נבחרו. ד אזור בעל עניין (התיבה האדומה ב- C) מוצג כדי להדגים הגבולות של הנתונים נמצאים ב- supervoxels עצמם. אי שלוש פרוסות של אמצעי האחסון עם ביאורים ידנית של אזורים שונים של ערכת הנתונים מוצגים בצבעים כהים (ירוק, אדום, כחול וסגול) ואת תחזיות לאחר הפעלת מודל אימון המוצגים באותם צבעים בהירים. פ הפרוסות שלוש אותו עם פילוח הסופי לאחר מודל אימון הנבואה התקבלו. גודל ברים הם 1 מ מ. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.
באיור 4. עיבוד של cryoET הנתונים (dataset) באמצעות אסטרטגיה פילוח אזור סופר.
א פרוסה 2D יחיד של הנתונים הגולמיים. ב' אזור בעל עניין (התיבה האדומה א') עם סט בשכבות מסנן שהוחל להדגיש את הגבולות של organelles. ג . דוגמה ביאור של אברון באמצעות אזורים-העל. אברון אחד מוצג עם supervoxels ועליהן הביאור משתמש ידני מוצגים בשחור (משמאל), את supervoxels נבחר עם ביאור זה מוצג בצבע כחול (מימין). ד . דוגמה ביאור microtubule באמצעות אזורים-העל. אזור בודד של microtubule מוצג עם הביאור משתמש ידני מוצג שחור (משמאל) את supervoxels נבחר עם ביאור זה מוצגים בירוק (מימין). אי פילוח הסופי הכולל של טסיות מקוטע מהרקע באמצעות מודל אימון (לפרטים, ראה טבלה 1), ו organelles השונות microtubules מקוטע באמצעות אסטרטגיה פילוח אזור סופר. צבעים אינן מצביעות על סוגי אברון ספציפי כפי שהן מופיעות כאן לפני סיווג. גודל ברים A, B ו- E הם 1 μm ו ב C ו- D הם 0.5 μm. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.
איור 5. ניתוח של cryoSXT הנתונים (dataset) באמצעות כלי ספליטר תווית.
א פרוסה 2D יחיד של הנתונים הגולמיים. ב' אזור בעל עניין (התיבה האדומה א') עם וריאציה הכולל סינון מוחל כדי להדגיש את organelles. ג. פילוח הסופי עם supervoxels בשכבות. ד החלק ויזואליזציה של המפצל תווית עם organelles מסווג באמצעות כללי מוצגים ב- F. אי בחלק מגרש של המפצל תווית מציג את העוצמה הממוצעת בתוך כל אובייקט, עם הכללים המוצג נ חלה. כל שורה אנכית לאורך ציר ה-x מייצג אובייקט בודד, מסומן בצבע כדי להתאים את הכיתה שזה הועבר לטיפולו. דוגמה פ כללי סיווג להפרדת אובייקטים שונים על סמך מאפייניהם הטבועה. גודל ברים הם 1 μm. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.
שם / נתונים (dataset) | מקור | P1 | P2 | P3 | P4 |
סינון לפי עקומת גאוס | סיגמא | ||||
טווח / ברירת מחדל | - | [0.5, 10] / 1 | |||
CryoET (G1) | הנתונים הגולמיים | 1 | |||
CryoET (G2) | הנתונים הגולמיים | 2 | |||
וריאציה סה | למדא | מרווח | # איטר | קלאמפ | |
טווח / ברירת מחדל | - | [0.1, 30] / 10 | [0.1, 10] / 1 | [50, 500] / 100 | - |
MicroCT (TV1) | הנתונים הגולמיים | 10 | 1 | 100 | (1-) |
CryoET (TV2) | G1 | 7 | 1 | 200 | - |
CryoET (TV3) | G2 | 10 | 1 | 100 | - |
CryoSXR (א TV4) | הנתונים הגולמיים | 7 | 1 | 100 | - |
קביעת סף | Vmin | Vmax | |||
טווח / ברירת מחדל |
טבלה 1. פרמטרים אופטימליים להשתמש כדי לעבד כל אחד Datasets שלוש (microCT, cryoET ו- cryoSXT).>
עבור כל פרמטר, ברירת המחדל בעלת טווח למטרה כללית ניתנים. במקרים רבים משמש כמקור נתונים מסוננים לעיבוד במורד הזרם. במקרים אלה, קיצור משמש לציון את ערכת הנתונים מקור חדש. לדוגמה, G1 (הנתונים הגולמיים של cryoET מסוננים לפי עקומת גאוס) שימש קלט במהלך וריאציה הכולל מסנן כדי ליצור TV2. המידע מוצג רק עבור היבטים עבודה, שעליו מונחים ששימשו לעבד את כל הנתונים (dataset). לדוגמה, מודל אימון לא שימש במהלך עיבוד של הנתונים (dataset) cryoSXT המובאים כאן, לכן ללא פרמטרים מקבלים על זה.
SuRVoS עבודה, שעליו מונחים שונה מזה של תוכניות אחרות פילוח אופטימיזציה של פרמטרים היא צעד הכרחי וחשוב לפני תחילת את פילוח בפועל. בתוכניות מסוימות פילוח ידנית או חצי ידנית, המשתמש מתחיל הממיין תוך רגעים ספורים של פתיחת פרוייקט חדש. עם SuRVoS, בגלל כמויות גדולות של אמצעי האחסון מקוטע עם קלט מועט מהמשתמש גבולות מפורטים על-ידי התוכנית, אופטימיזציה של הפרמטרים הינה קריטית פילוח מוצלחת. באופן ספציפי, תכונה ערוצי סופר-אזור בילדינג נמצאים בשני תחומים שבהם צריך להיות משולם תשומת לב.
ערוצי תכונה והכשרה מודל
בנוסף הנתונים הגולמיים, SuRVoS מאפשר למשתמש ליצור datasets נוספים או ערוצי נגזר על ערכת נתונים קיימים. ערוצים אלה יכולים להיווצר באמצעות מבחר של מתודולוגיות חישובית או תכונה תמציות. כל אחת מייצגת נתונים זמינים במקביל, וכן יכולים להיות מוצגים בנפרד כדי להעריך את התוצאות של יישום תכונה או המסנן. בשל מאפיינים אלו, מתייחסים אליהם כאל תכונה ערוצים ב- SuRVoS. ישנן אפשרויות רבות ערוץ תכונה שרשמת SuRVoS. לקבלת מידע אודות האפשרויות ואת הפרמטרים משמש כאן, ראה טבלה 1, עבור רשימה מלאה ולבקר תיאור של תכונה זמינה ערוצי https://diamondlightsource.github.io/SuRVoS/ 2. ראשית, רועש datasets יהנה denoising עם גאוסיאן או סיכום וריאציה מסנן. מומלץ נוסף חישובי ערוץ ו supervoxel/megavoxel תכונה להתבצע באמצעות אחד אלה datasets denoised כמקור הנתונים. בדרך כלל, ערכת הנתונים הכולל וריאציה denoised משמש כנתוני המקור עבור תכונה חישובי ערוץ ו supervoxel/megavoxel. הוא הציע להפעיל קודם עם ערכי ברירת המחדל, להעריך את התוצאה ב- 3D, סוף סוף, iteratively לייעל את הפרמטרים עבור ערכת הנתונים. בנוסף, כוללים ערוצי יכול להיות בנוי לתוך "מערכות סינון" כדי במיוחד לבודד את היבטי את ערכת הנתונים, אלה יכולים מכן לשמש כמקורות נתונים, ליצור supervoxels ו- megavoxels. בעוד אסטרטגיה זו היא מאוד dataset התלויים, זה יכול להיות מועיל.
תכונה ערוצי משמשים גם כמקורות לאמן את המסווג באימון מודל. כאשר מחליטים על איזו תכונה ערוצים לשימוש, מומלץ כי כמה ערוצים התכונות החזקה (למשל, זיהוי הכתמים, מרקם, מבנה או תכונות חזקות קטגוריות) משמשים בעת עבודה עם כמות קטנה של ביאורים לאמן . מסווג. בעת עבודה עם כמות גדולה של נתונים אימון, מומלץ להשתמש יותר ערוצי תכונה כללית, מכל הקטגוריות כל עוד הם מספקים מידע מגוונים למסווג (למשל, להוסיף הערוצים תכונה הרשימה לעיל מתוך מקומי תכונות וקטגוריות תכונות לפי עקומת גאוס).
ישנם שלושה חלקים עיקריים מודל אימון: מתן מקורות קלט נתונים המתארים הנתונים, באמצעות תשומות אלה לאמן מסווג, וכוונון סוף סוף את תחזיות פלט. באופן כללי, אזורים קטנים של הנתונים ידרוש עוד ביאורים למשתמש לאמן במדויק את המסווג, בעוד אזורים גדולים יותר של הנתונים ידרוש פחות משתמש ביאורים. מודל אימון קודם מבלי לבחור עידון ניתן למצוא את תחזיות הטוב ביותר. לאחר מכן לכלול העידון, למטב את פרמטר למדא כנדרש, כדי לתקן את הבעיות עם הנבואה כגון חורים או קצוות משוננים.
Supervoxels, megavoxels
Supervoxels הם אשכולות רבים בקרבת מקום,38,voxels דומה39. Supervoxels מתחילים כמו רשת 3D סטנדרטי על הנתונים ואז מום iteratively על מנת לדבוק לגבולות הבסיסית, לכן כדאי שייצגו את הנתונים. Supervoxel ויצירת דפורמציה נשלטת על ידי ארבעה לקלט מהמשתמש: מקור הנתונים, superpixel צורה, ריווח, הקומפקטיות. מקור הנתונים מספק את תשומות הנתונים יישאלו במהלך יצירת supervoxel. ניתן להשתמש מכל מקור שהוא לרבות מקורות נתונים מסוננים. הפרמטרים צורה superpixel קבע הזינוק התלת-ממד לצורה הרצויה משוער של supervoxels שנוצר. שינוי פרמטרים אלה באפשרותך להגדיל או להקטין supervoxels לפני דפורמציה. הפרמטרים ריווח להגדיר את החשיבות של גבולות לכל כיוון. שינוי פרמטרים אלה מדגישים גבולות באחד או בשני כיוונים על חשבון האחר (s), כלומר את supervoxels שנוצר עיוות לעקוב טוב יותר גבולות נתונים direction(s) נתון. הפרמטר האחרון, הקומפקטיות, קובע כמה supervoxels יכולה לעוות. מספר הקומפקטיות נמוכה מאפשרת את supervoxels לעוות יותר. פרמטרים אלה צריכים להיות מוטבת לספק supervoxels המייצגים את הגבולות של נתונים מעניינים. הערה: כיום, פרמטרים צורה supervoxel להיות שווה 1024 או פחות כאשר התרבו ביחד.
במובנים מסוימים, supervoxel פרמטרים יכול לפצות על אחד את השני, כלומר אין אף אחד "התשובה הנכונה" כאשר מחליטים על פרמטרים. לדוגמה, רשת התחלה גדולים (למשל superpixel צורה: 10 x 10 x 10) ואת מספר הקומפקטיות נמוך (דוגמה 20) רשאי לתת supervoxels עם הדבקות גבול דומה לעומת רשת התחלה קטנה (למשל superpixel צורה 5 x 5 x 5), גבוהה יותר מספר הקומפקטיות (למשל 50). מכיוון שישנם יותר, קטן יותר supervoxels בתרחיש השני, הם לא חייבים לעוות כל כך הרבה כדי לייצג את גבולות. שני מערכי הפרמטרים יכול להיות מתאים חלוקת ערכת הנתונים.
השיקול הגדול ביותר בעת בחירת הפרמטרים supervoxel הוא כמה טוב supervoxels מייצגים את הנתונים. הצגת את supervoxels לבד, בלי נתונים מתחתם, כמו איור דו-ממדי, היא דרך טובה להעריך supervoxel פרמטרים. בעת הצגת בדרך זו, הקצוות ואת קווי המתאר של צורות נמצאו הנתונים עדיין צריך להיות גלוי supervoxels.
Megavoxels הם וקונצרנים של מספר שכנים, בדומה supervoxels38,39. הם נשלטים על ידי ארבעה לקלט מהמשתמש שוב: מקור הנתונים, למבדה, numbins וגמא. בדומה supervoxels, מקור הנתונים מספק את תשומות הנתונים יישאלו במהלך יצירת megavoxel. למדא וגם numbins השפעת גודל וגבול הדבקות של megavoxels. ככל megavoxels גדלים גדולים יותר (גבוהה למדא, numbins נמוך), שדבקו גבול פוחתת. היפוכה הוא גם נכון, גבול הציות יגדל עם megavoxels קטן יותר (למדא נמוך, numbins גבוהה), אולם כפי מקטין גודל megavoxel, כך גם התועלת שלהם ב הממיין כמויות גדולות של voxels במהירות. הפרמטר האופציונלי גמא שולט הגורם החלקות לעומת העלות של מיזוג שני supervoxels ביחד. ערכים קטנים של גמא ניתן לשפר את הדמיון בין שתי supervoxels, על חשבון שיש הכוללת פחות megavoxels.
כמו supervoxels, השיקול הגדול ביותר בעת בחירת ומיטוב פרמטרים megavoxel הוא כמה טוב megavoxels מייצגים את הנתונים. ניתן להשתמש שוב מציג את megavoxels לבד כמתואר עבור supervoxels להערכת פרמטרים. עם זאת, מכיוון megavoxels בדרך כלל יהיה הרבה יותר גדול הם תלת מימדי, באמצעות ה-t כלי ביאורo לבחור megavoxels יחיד כדי להבטיח הגבול בין אזורי עניין חזק מומלץ גם.
ביאור אסטרטגיה
תוארו שתי אסטרטגיות ביאור כללי: בגישה האימונים מודל שימושי עבור הפרדת אזורים גדולים של מבנה נתונים, בעוד בגישה פילוח אזור סופר שימושי עבור תכונות קטן יותר, יותר מגוונת כגון organelles בודדים. ניתן לארגן ביאורים באופן הירארכי כך ניתן להוסיף ביאורים אזורים גדולים קודם, ואז לסעף את אותם אזורים ספציפיים יותר באמצעות קשר הורה-ילד. ניתן להקצות את תווית אב עבור תווית על ידי לחיצה על האזור בצד ימין של תווית צבע הבחירה ובחירה תווית אב המתאים מרמה קודמת. בפועל, רוב datasets להשתמש מודל ההכשרה והן סופר-אזור פילוח אסטרטגיות כדי פילוח אזורי/תכונות ספציפיות של ריבית.
בדוגמה מודל אימון כאן, כמה תשומות ההכשרה (בצורה של המשתמש ידני המבוסס על supervoxel ביאורים) שימשו על שלוש פרוסות במרווחים באותה מידה של הנתונים. בדרך זו, ההיבט הכשרה מודל של SuRVoS במידה רבה מגביר את מהירות שבה פילוח הוא אפשרי במיוחד כאשר עובדים עם גדולים, הבדיל אזורים כגון הפער בין האזורים בגוף fruiting goosegrass כפי שמסומן ב- איור 3.
כאשר מודל הדרכה, אם לא ניתן לראות את תחזיות, זה ייתכן שיהיה צורך גש לכרטיסיה ויזואליזציה ולוודא כי השכבה תחזיות מופעלת והגדר הכמות המתאימה של שקיפות. כמו כן, ביטחון של 0 להקצות כל supervoxel ללא תווית תווית, בהתבסס על מה ההתאמה הקרובה ביותר היא. ביטחון של 100 להקצות תווית רק אם רק קטגוריה אחת של תוויות יש התאמה פרופורציונלית. מה שביניהם םייק של שני קצוות אלה. בעת בחירת רמת ודאות הוא הציע לבדוק כמה פרוסות לבחון מבחינה ויזואלית כי שם הם לא voxels באופן שגוי החזוי לפני שמירת הנבואה על תווית.
אסטרטגיה טובה עבור הוספת ביאורים באמצעות אזורים-העל היא להשתמש בכלי ההגדלה כדי להגדיל את תצוגת הנתונים, ביאורים organelles כמה בבת אחת על פרוסה אחת, באמצעות גישה של "מהיר, מבולגן" קודם (איור 4C). בשלב הבא, הזז למעלה או למטה כמה פרוסות ב- Z, חזור על תהליך זה. מאחר supervoxels הם תלת מימדי, רבים המגרעות של הגישה "מבולגן" נפתרות על-ידי ביאורים בדוגמא למעלה או למטה פרוסות. בדרך זו, פילוח הוא האיץ את, הגבולות הינם מסופקים על ידי supervoxels ולא באופן ידני.
לנקות את תווית, סופקו אפשרויות פילוח סטנדרטי עידון. התארכות גורמת התווית שנבחרה פילוח לגדול ע י נתון רדיוס, שחיקה גורמת לו להתכווץ. פתיחה וסגירה של אלו היישום של שחיקת הראשון ואז התארכות, או להיפך, בהתאמה. מילוי חורים עושה בדיוק את זה. משנה הסדר של פעולות אלה. באופן כללי, מבצע מילוי חורים, ולאחר מכן פתיחה ולאחר מכן התארכות עובד היטב. כל שיטת עידון יכול להיות מיושם על פרוסה אחת ("זו פרוסה"), על כל הפרוסות ב- 2D ("כל הפרוסות (2D)") או ב- 3D ("כל אמצעי אחסון (3D)"). כל הפרוסות (2D) מומלץ.
משמעויות וכיוונים עתידיים
פילוח יעיל ומדויק הוא צוואר הבקבוק הבא בעיבוד של datasets תלת-ממד, במיוחד עם אוסף אוטומטית שגרתית של טרה-בתים של נתוני התמונה במהלך מפגשים הארוך. SuRVoS עבודה, שעליו מונחים באפשרותך להאיץ את התהליך. פילוח לפי פקטור של 5 לעומת פילוח ידנית. גם, כי הגבולות מפורטים על-ידי supervoxels, ההשתנות של segmentations תוצאות צריך לשפר. בעתיד, אנו מקווים לבחון דרכים באמצעות את פילוח של אזור 3D נציג עניין כנתונים הכשרה כדי להחיל שאר אמצעי האחסון, או אפילו כאמצעי אחסון נפרדים, עם ביטחון עצמי גבוה. זה מראש להקטין עוד יותר את כמות זמן המשתמש ואת קלט צורך כרכים ביולוגיים מורכבים אפילו קטע, עוזר כדי להקל על עיבוד של פילוח צוואר הבקבוק תמונה. בתורו, פעולה זו תאפשר השוואה כמותית של נתונים ביולוגיים במצבים שונים (למשל אי-מחלה, מחלת, מטופלים) במספרים ניסיוני חזקים.
המחברים מצהירים שיש להם אינטרסים כלכליים אין מתחרים.
אנחנו רוצים להכיר ולהודות Rui וואנג, צ'יו ווה מ ביילור לרפואה למתן את ערכת הנתונים cryoET, אנדרו Bodey ממקור אור יהלום עבור סיוע beamtime I13. חלקים של מחקר זה היו נתמך על ידי המענק הלאומית המכונים לבריאות (NIH) מס (P41GM103832) אנו להכיר מקור אור יהלום למימון במשותף Imanol Luengo תחת PhD STU0079.
Name | Company | Catalog Number | Comments |
computer | n/a | n/a | Must be running Linux operating system and have an NVidia GPU with at least 4 GB of memory |
Request permission to reuse the text or figures of this JoVE article
Request PermissionThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. All rights reserved