A subscription to JoVE is required to view this content. Sign in or start your free trial.
Method Article
נקודת השינוי בייס שלנו (BCP) אלגוריתם בונה על התקדמות מדינה-of-the-art בדוגמנות שינוי נקודות באמצעות מודלי מרקוב נסתרים וחייל אותם על הכרומטין immunoprecipitation ניתוח נתוני רצף (ChIPseq). BCP מבצע היטב בסוגי נתונים רחבים וpunctate, אבל מצטיין בזיהוי איים חזקים, לשעתק של העשרת היסטון מפוזרת באופן מדויק.
ChIPseq היא טכניקה המשמשת באופן נרחב לחקר אינטראקציות-DNA חלבון. קראו פרופילי צפיפות נוצרים באמצעות הבא של רצף ה-DNA של חלבון נישא ויישור הקצר קורא לגנום הפניה. אזורים מועשרים מתגלים כפסגות, אשר לעתים קרובות נבדלים באופן דרמטי במצב, תלוי בחלבון המטרה 1. לדוגמה, לעתים קרובות גורמי שעתוק להיקשר באתר ואופן רצף ספציפי ונוטים לייצר פסגות punctate, תוך שינויי היסטון הם נפוצים יותר ומאופיינים באיים רחבים, מפוזרים של העשרה 2. אמין זיהוי אזורים אלה היה המוקד של העבודה שלנו.
אלגוריתמים לניתוח נתוני ChIPseq העסיקו מתודולוגיות שונות, משיטות היוריסטיות 3-5 ליותר מודלים סטטיסטיים קפדניים, מודלי מרקוב נסתרים (למשל הממ) 6-8. אנחנו חפשנו פתרון שהקטין את הצורך לקשה להגדרה, אד הוק פרמטרים שלעתים קרובותהרזולוציה להתפשר ולהפחית את השימושיות אינטואיטיבית של הכלי. עם כל כבוד לשיטות HMM מבוססים, אנו מכוונים לצמצום שיטות אמידות פרמטרים וסיווגים פשוטים, סופיים מדינה שלעתים קרובות מנוצלים.
בנוסף, ניתוח נתוני ChIPseq קונבנציונלי כרוך סיווג צפוי לקרוא פרופילי צפיפות כאחד punctate או מפוזר ואחרי היישום הבא של הכלי המתאים. אנחנו עוד מטרה להחליף את הצורך בשני דגמים שונים אלה עם מודל יחיד, תכליתי יותר, שיכול לטפל בכשרון את כל הספקטרום של סוגי נתונים.
כדי לעמוד ביעדים אלה, אנו נבנינו מסגרת סטטיסטית הראשונים שככבו באופן טבעי מבני ChIPseq נתונים באמצעות מראש חוד חנית ב9 הממ, אשר מנצל מפורשות רק נוסחות-חדשנות חיונית ליתרונות הביצועים שלה. מודלים מתוחכמים יותר אז האוריסטי, HMM להכיל מצבים נסתרים אינסופיים דרךמודל ייס. אנחנו יישמנו אותו לזיהוי נקודתי שינוי סבירות בצפיפות לקרוא, אשר נוסף להגדיר מקטעים של העשרה. הניתוח שלנו גילה כמה ייס שינוי נקודת האלגוריתם שלנו (BCP) הייתה מורכבות חישובית, שמעידות מופחתות זמן ריצה מתומצת וגודל פיזי של זיכרון. אלגוריתם BCP יושם בהצלחה לשניהם שיא punctate והזדהות אי מפוזרת עם דיוק חזק ופרמטרים מוגדרים משתמש מוגבלים-. זה מאויר הן צדדי וקל שימוש שלה. כתוצאה מכך, אנו מאמינים כי ניתן ליישם בקלות בטווח הרחב של סוגי הנתונים ומשתמשי קצה באופן שהוא קל להשוואה וניגוד, מה שהופך אותו לכלי מצוין לניתוח נתוני ChIPseq שיכול לסייע בשיתוף פעולה ואימות בין קבוצות מחקר. הנה, אנחנו מדגימים את היישום של חומר לגורם שעתוק קיים ונתוני 10,11 epigenetic 12 כדי להמחיש את השימושיות שלה.
1. הכנת קבצי קלט לBCP ניתוח
2 א. לפזר קראו פרופילים: שבב preprocessing נקרא צפיפות לאיתור של איים מועשרים בנתונים לדיה
2b. פרופילי Punctate לקרוא: שבב preprocessing וקבצי BED קלט לאיתור של פיקס בנתוני Punctate
3. מעריך האחורי Mean נקרא צפיפות של כל בלוק באמצעות קירוב BCMIX
4 א. לפזר קראו פרופילים: אמצעי אחורי לאחר התהליך למקטעים של העשרה מפוזרת
4 ב. Punctate קרא פרופילים: אמצעי אחורי לאחר התהליך למועמדי שיא
BCP מצטיין בזיהוי האזורים של העשרה רחבה בנתוני השינוי היסטון. כנקודת התייחסות, השוו את התוצאות שלנו בעבר לאלה של 3 SICER, כלי קיים אשר הוכיח ביצועים חזקים. הטוב ביותר להמחיש את היתרונות של BCP, בדק שינוי היסטון שנחקר היטב הוא ליצור בסיס להערכת שיעורי הצלחה. עם זה בחשבו?...
אנחנו יצאנו לפתח מודל לניתוח נתוני ChIPseq שיכולים לזהות את שני מבני נתוני punctate ומפוזרים היטב באותה מידה. עד עכשיו, אזורים של העשרה, אזורים מפוזרים במיוחד, המשקפים את ציפיות גודל נחת האי גדול, שהיו קשים לזיהוי. כדי לטפל בבעיות אלה, אנו נצלנו את החידושים האחרונים בטכנולוגי...
אין ניגודי האינטרסים הכריזו.
פרס סטאר יסוד (MQZ), מענק NIH ES017166 (MQZ), NSF מענק DMS0906593 (HX).
Name | Company | Catalog Number | Comments |
שם המגיב | חברה | מספר קטלוגים | תגובות (אופציונלי) |
תחנת עבודה מבוססת לינוקס |
Request permission to reuse the text or figures of this JoVE article
Request PermissionThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. All rights reserved