Method Article
פרוטוקול זה מתאר את שיטת Capture Hi-C המשמשת לאפיון הארגון התלת-ממדי של אזורים גנומיים ממוקדים בגודל מגה-מבוסס ברזולוציה גבוהה, כולל גבולות של תחומים משויכים טופולוגית (TADs) ואינטראקציות כרומטין ארוכות טווח בין אלמנטים רגולטוריים ורצפי DNA אחרים.
הארגון המרחבי של הגנום תורם לתפקודו ולוויסותו בהקשרים רבים, כולל שעתוק, שכפול, רקומבינציה ותיקון. הבנת הסיבתיות המדויקת בין טופולוגיית הגנום לתפקוד היא אפוא חיונית והופכת יותר ויותר לנושא למחקר אינטנסיבי. טכנולוגיות לכידת קונפורמציה של כרומוזומים (3C) מאפשרות להסיק את המבנה התלת-ממדי של הכרומטין על ידי מדידת תדירות האינטראקציות בין כל אזור בגנום. כאן אנו מתארים פרוטוקול מהיר ופשוט לביצוע Capture Hi-C, שיטת העשרת מטרות מבוססת 3C המאפיינת את הארגון התלת-ממדי הספציפי לאלל של מטרות גנומיות בגודל מגה-מבוסס ברזולוציה גבוהה. ב- Capture Hi-C, אזורי המטרה נלכדים על ידי מערך של גשושיות ביוטיניליות לפני ריצוף במורד הזרם. לפיכך, רזולוציה גבוהה יותר וספציפיות אלל מושגות תוך שיפור יעילות הזמן והמחיר המשתלם של הטכנולוגיה. כדי להדגים את נקודות החוזק שלו, פרוטוקול Capture Hi-C הוחל על מרכז ההפעלה X של העכבר ( Xic), מוקד הבקרה הראשי של השבתת כרומוזום X (XCI).
הגנום הליניארי מכיל את כל המידע הדרוש לאורגניזם כדי לעבור התפתחות עוברית ולשרוד לאורך כל הבגרות. עם זאת, הנחיית תאים זהים גנטית לבצע פונקציות שונות היא בסיסית לשליטה מדויקת במידע המשמש בהקשרים ספציפיים, כולל רקמות שונות ו / או שלבי התפתחות. הארגון התלת-ממדי של הגנום נחשב כמשתתף בוויסות מרחבי-זמני מדויק זה של פעילות הגנים על ידי הקלה או מניעה של אינטראקציה פיזית בין אלמנטים רגולטוריים שניתן להפריד על ידי כמה מאות קילו-בסיסים בגנום הליניארי (עבור סקירות 1,2,3). ב-20 השנים האחרונות, הבנתנו את יחסי הגומלין בין קיפול גנום ופעילות גדלה במהירות, בעיקר הודות לפיתוח טכנולוגיות ללכידת קונפורמציה של כרומוזומים (3C) (לסקירה 4,5,6,7). שיטות אלה מודדות את תדירות האינטראקציות בין אזורים כלשהם בגנום ומסתמכות על קשירת רצפי דנ"א הנמצאים בסמיכות תלת-ממדית בתוך הגרעין. פרוטוקולי 3C הנפוצים ביותר מתחילים בקיבוע אוכלוסיות תאים עם סוכן cross-linking כגון פורמלדהיד. הכרומטין הצולב, לאחר מכן מתעכל עם אנזים הגבלה, אם כי עיכול MNase שימש גם 8,9. לאחר העיכול, קצוות הדנ"א החופשי בקרבה מרחבית קרובים נקשרים מחדש, והקישור הצולב. שלב זה מוליד את "הספרייה" או "התבנית" של 3C, מאגר מעורב של מקטעים היברידיים שבו רצפים שהיו בקרבה תלת-ממדית לגרעין הם בעלי סיכוי גבוה יותר להיקשר באותו מקטע DNA. הכימות במורד הזרם של מקטעים היברידיים אלה מאפשר להסיק את הקונפורמציה התלת-ממדית של אזורים גנומיים הממוקמים אלפי זוגות בסיסים זה מזה בגנום הליניארי, אך עשויים לקיים אינטראקציה במרחב התלת-ממדי.
גישות רבות ושונות פותחו כדי לאפיין את ספריית 3C, הנבדלות זו מזו הן מבחינת תת-קבוצות של מקטעי קשירה מנותחות והן מבחינת הטכנולוגיה המשמשת לכימות במורד הזרם. פרוטוקול 3C המקורי הסתמך על בחירת שני אזורי עניין וכימות תדירות האינטראקציה שלהם 'אחד מול אחד' על ידי PCR10,11. גישת 4C (לכידת קונפורמציה מעגלית של כרומוזומים) מודדת את יחסי הגומלין בין מוקד עניין יחיד (כלומר, "נקודת המבט") לבין שאר הגנום ("אחד מול כולם")12,13,14. ב-4C, ספריית 3C עוברת סבב שני של עיכול וקשירה מחדש כדי ליצור מולקולות DNA מעגליות קטנות המועצמות ב-PCR על ידי פריימרים ספציפיים לנקודת מבט15. 5C (Chromosome Conformation Capture Carbon Copy) מאפשר אפיון של אינטראקציות תלת-ממדיות על פני אזורי עניין גדולים יותר, ומספק תובנות לגבי קיפול כרומטין מסדר גבוה יותר בתוך אזור זה ("רבים לעומת רבים")16. ב-5C, ספריית 3C עוברת הכלאה למאגר של אוליגונוקלאוטידים החופפים לאתרי הגבלה שניתן להגביר לאחר מכן על ידי מולטיפלקס PCR עם פריימרים אוניברסליים15. הן ב-4C והן ב-5C, מקטעי הדנ"א האינפורמטיביים כומתו בתחילה על ידי מיקרו-מערכים ומאוחר יותר על ידי ריצוף הדור הבא (NGS)17,18,19. אסטרטגיות אלה מאפיינות אזורי עניין ממוקדים, אך לא ניתן ליישם אותן כדי למפות אינטראקציות ברחבי הגנום. מטרה אחרונה זו מושגת באמצעות Hi-C, אסטרטגיה מבוססת 3C בעלת תפוקה גבוהה שבה ריצוף מקבילי מאסיבי של תבנית 3C מאפשר אפיון בלתי מוטה של קיפול כרומטין ברמת הגנום הרחב ('הכל לעומת כולם')20. פרוטוקול Hi-C כולל שילוב של שאריות ביוטינילציה בקצות השברים המעוכלים, ולאחר מכן משיכה כלפי מטה של מקטעי קשירה עם חרוזי סטרפטווידין כדי להגביר את ההתאוששות של שברים קשורים20.
Hi-C גילה כי גנומים של יונקים מאורגנים באופן מבני בקני מידה מרובים בגרעין התלת-ממדי. בסקאלת המגה-בסיס, הגנום מחולק לאזורים של כרומטין, כרומטין, תאים A ו-B, בהתאמה20,21. קיומם של תת-תאים נוספים המיוצגים על ידי מצבי כרומטין ופעילות שונים הוצג גם הוא לאחר מכן22. ברזולוציה גבוהה יותר, הגנום מחולק עוד יותר לתחומים תת-מגה-בסיסים בעלי אינטראקציה עצמית הנקראים תחומים שיוך טופולוגי (TADs), שנחשפו לראשונה על ידי ניתוח Hi-C ו-5C של גנום האדם והעכבר23,24. בניגוד לתאים המשתנים באופן ספציפי לרקמות, TADs נוטים להיות קבועים (אם כי ישנם יוצאים מן הכלל רבים). חשוב לציין, גבולות TAD נשמרים בין מינים25. בתאי יונקים, TADs כוללים לעתים קרובות גנים החולקים את אותו נוף רגולטורי והוכחו כמייצגים מסגרת מבנית המאפשרת ויסות משותף של גנים תוך הגבלת האינטראקציות עם תחומי בקרה שכנים (לסקירה 3,26,27,28). יתר על כן, בתוך TADs, אינטראקציות עקב אתרי CTCF בבסיס של לולאות cohesin-extruded עשוי להגדיל את ההסתברות של אינטראקציות מקדם-משפר או משפר משפר (לסקירה29).
ב- Hi-C, ניתן לזהות תאים ו- TADs ברזולוציה של 1 Mb עד 40 kb, אך ניתן להשיג רזולוציה גבוהה יותר כדי לאפיין מגעים בקנה מידה קטן יותר כגון אינטראקציות לולאה בין אלמנטים דיסטליים בקנה מידה של 5-10 kb. עם זאת, הגדלת הרזולוציה כדי להיות מסוגל לזהות לולאות כאלה ביעילות על ידי HiC דורש עלייה משמעותית בעומק הרצף, ולכן, עלויות רצף. זה מחמיר אם הניתוח צריך להיות ספציפי אלל. ואכן, עלייה של פי X ברזולוציה דורשת עלייה של X2 בעומק הריצוף, כלומר גישות ברזולוציה גבוהה וספציפיות לאלל יכולות להיות יקרות מאוד30.
כדי לשפר את העלות-תועלת והמחיר המשתלם תוך שמירה על רזולוציה גבוהה, ניתן למשוך פיזית את אזורי היעד המעניינים אותם מספריות 3C או Hi-C רחבות גנום לאחר ההכלאה שלהם עם בדיקות אוליגונוקלאוטידים משלימות המסומנות בביוטין לפני ריצוף במורד הזרם. אסטרטגיות העשרת מטרות אלה מכונות שיטות Capture-C ומאפשרות חקירה של אינטראקציות של מאות מיקומי מטרה הפזורים ברחבי הגנום (כלומר, Promoter Capture (PC) Hi-C; הדור הבא (NG) Capture-C; קלט נמוך (LI) לכידה-C; לכידת טיטרייטד גרעיני (NuTi)-C; Tri-C)31,32,33,34,35,36,37,38,39,40, או על פני אזורים המשתרעים על פני מספר מגה-בסיסים (כלומר, Capture HiC; HYbrid ללכוד Hi-C (Hi-C2); Tiled-C)41,42,43. שני היבטים יכולים להשתנות בשיטות מבוססות לכידה: (1) האופי והעיצוב של אוליגונוקלאוטידים ביוטיניליים (כלומר, RNA או DNA, אוליגוס יחיד לוכד מטרות גנומיות מפוזרות או אוליגוס מרובים המרצפות אזור עניין); ו-(2) התבנית המשמשת למשיכת מטרות כלפי מטה שיכולה להיות ספריית 3C או Hi-C, האחרונה מורכבת מקטעי הגבלה ביוטיניליים שנמשכו מספריית 3C.
כאן מתואר פרוטוקול Capture Hi-C המבוסס על העשרת אנשי קשר יעד מספריית 3C. הפרוטוקול מסתמך על תכנון מערך ריצוף מותאם אישית של בדיקות RNA ביוטינילציה וניתן לבצע אותו תוך שבוע אחד מהכנת ספריית 3C ועד לריצוף NGS. הפרוטוקול מהיר, פשוט, ומאפשר לאפיין ארגון תלת-ממדי מסדר גבוה יותר של אזורי עניין בגודל מגה-בסיס ברזולוציה של 5 קילו-בתים תוך שיפור יעילות הזמן והמחיר המשתלם בהשוואה לשיטות 3C אחרות. פרוטוקול Capture Hi-C הוחל על מוקד הבקרה הראשי של השבתת כרומוזום X (XCI), מרכז X-inactivation (Xic), המארח את ה-RNA הלא מקודד Xist. ה- Xic היה בעבר נושא לניתוחים מבניים ופונקציונליים נרחבים (לסקירה44,45). ביונקים, XCI מפצה על המינון של גנים מקושרי X בין נקבות (XX) לזכרים (XY) וכולל השתקת שעתוק של כמעט כל אחד משני כרומוזומי X בתאי נקבה. ה- Xic ייצג מוקד רב עוצמה ותקן זהב למחקרים בטופולוגיה גנומית תלת-ממדית וליחסי הגומלין עם בקרת גנים44. ניתוח 5C של Xic בתאי גזע עובריים של עכברים (mESCs) הוביל לגילוי ושיום של TADs, וסיפק את התובנות הראשונות לגבי הרלוונטיות התפקודית של חלוקה טופולוגית וויסות משותף של גנים24. הארגון הטופולוגי של ה-Xic הוכח לאחר מכן כמעורב באופן קריטי בתזמון ההתפתחותי המתאים של Xist upregulation ו-XCI 46, ואלמנטים לא חשודים של cis-regulatory שיכולים להשפיע על פעילות גנים בתוך ובין TADs התגלו לאחרונה גם בתוך Xic47,48,49. החלת Capture Hi-C על 3 Mb של כרומוזום X של העכבר המשתרע על פני Xic מדגימה את כוחה של גישה זו בניתוח קיפול כרומטין בקנה מידה גדול ברזולוציה גבוהה. פרוטוקול מפורט וקל למעקב מסופק, החל מתכנון מערך הגשושיות הביוטיניליות בכל אתר הגבלת DpnII באזור העניין ועד ליצירת ספריית 3C רחבת גנום, הכלאה ולכידת אנשי קשר מטרה, וניתוח נתונים במורד הזרם. כמו כן נכללת סקירה כללית של בקרות האיכות המתאימות והתוצאות הצפויות, והן נקודות החוזק והמגבלות של הגישה נדונות לאור שיטות קיימות דומות.
תאי הגזע העובריים של העכבר (mESCs) ששימשו במחקר זה נגזרו מצלב של נקבת TX/TX R26 rtTA/rtTA 50 עם זכר Mus musculus castaneus בהתאם להנחיות הטיפול בבעלי חיים של מכון קירי (פריז)51.
1. תכנון בדיקה
2. הליך ניסיוני
3. ניתוח נתונים
פרוטוקול Capture Hi-C המתואר מבוסס על הכנת תבנית 3C רחבת גנום באמצעות חותך בעל ארבעה בסיסים (DpnII). העשרה מאוחרת יותר של מקטעי קשירה על פני האזור הגנומי המעניין מתקבלת על-ידי הכלאה של מערך של גשושיות RNA מרוצפות ולכידת הסטרפטווידין שלהן בהתאם למערכת העשרת המטרה ששימשה במחקר זה (איור 1). בדיקות RNA ביוטינילציה נבחרו מכיוון שהן מראות זיקה הדוקה יותר למטרותיהם בהשוואה לגשושיות DNA52,60. לאחר מכן, ספריות שנלכדו נכללות באינדקס ומאוגדות לצורך ריצוף מרובה בתפוקה גבוהה. ניתן להציג באופן חזותי נתוני Hi-C ברזולוציה גבוהה כמפות אינטראקציה Hi-C ברזולוציה גבוהה, אך גם כמפות קשר בודדות דמויות 4C כדי להמחיש באופן ספציפי את האינטראקציות של רצפים קטנים יותר, כגון מקדמים או משפרים בתוך האזור כולו שנלכד. זרימת העבודה של הפרוטוקול מוצגת באיור 4. בקרות איכות קדם-ריצוף מוצגות באיור 2 וכוללות הערכה של עיכול תקין וקשירה מחדש של תבנית 3C וגזירה וטיהור יעילים שלה לאורך השלבים השונים של הפרוטוקול. הדנ"א של תבנית 3C צפוי לרוץ בין 150 ל-700 bp, ואין לזהות העשרה של מקטעים >2 קילובייט. במהלך השלבים הבאים, מבוצעים מספר שלבי ניקוי דנ"א מבוסס חרוזים ובחירת גודל, תחילה לאחר הגזירה, ולאחר מכן לאחר ה-PCR לפני הלכידה ולאחר הלכידה. ספריות מנוקות מציגות פרופיל העשרת מקטעים מובהק כפי שניתן לראות בביואנלייזר דנ"א בעל רגישות גבוהה (איור 2). גודל המקטע הממוצע גדל במהלך הכנת הספרייה עקב קשירת מתאמים, ריצוף ופריימרים לאינדוקס. בקרות איכות לאחר ריצוף מתקבלות באמצעות Hi-C Pro ומוצגות באיור 3. יישומי תוכנה ביואינפורמטיים רבים ושונים הוצעו לעיבוד וניתוח נתונים דמויי 3C. ביניהם, צינור HiC-Pro הוא אחד הפתרונות הפופולריים ביותר, המאפשר עיבוד של נתוני רצף גולמיים למפות הקשר הסופיות ברזולוציות שונות55. HiC-Pro משתמש באסטרטגיית מיפוי דו-שלבית כדי ליישר את קריאות הריצוף בגנום הייחוס. לאחר מכן מוצרי 3C משוחזרים ומסוננים כדי להסיר זוגות אנשי קשר שאינם אינפורמטיביים וליצור את מפות אנשי הקשר. בנוסף, הוא מסוגל להשתמש ברשימה של פולימורפיזמים ידועים כדי לבצע אנליזה ספציפית לאלל ולהפריד את המגעים המגיעים משני האללים ההוריים במפות קשר נפרדות. לאחרונה, HiC-Pro נכלל והורחב למסגרת nf-core (nf-core-hic), ומספק צינור מונחה קהילה61,62 הניתן להרחבה ולשחזור.
כדי ללכוד את העכבר Xic, תוכנן מערך של 28,913 גשושיות RNA המרצפות 3 Mb של כרומוזום X. אזור זה כולל את שחקן המפתח ב-XCI, הגן הארוך שאינו מקודד Xist, ואת הנוף הרגולטורי הידוע שלו ~800 קילו-בתים (איור 5). אזור ~ 800 kb זה מחולק לשני TADs: האחד כולל את מקדם Xist והרגולטורים החיוביים הידועים שלו (כלומר, התעתיקים שאינם מקודדים Ftx, Jpx ו- Xert והגן המקודד לחלבון Rnf12), וה- TAD השכן הכולל את מווסתי cis השליליים של Xist (כלומר, תעתיק האנטיסנס שלו Tsix, אלמנט המשפר Xite, ואת התמליל שאינו מקודד Linx) (לסקירה44, 45).
על ידי יישום פרוטוקול Capture Hi-C המתואר על Xic, הארגון הטופולוגי של מוקד זה התקבל ברזולוציה חסרת תקדים (איור 6 ואיור 7). הדבר בולט במיוחד כאשר משווים את פרופיל Capture Hi-C ל-5C47 שפורסם בעבר (איור 6 ואיור 7; טבלה משלימה 1) ו-Hi-C61 (איור 6 ואיור 7; טבלה משלימה 1) פרופילים. לדוגמה, מבני תת-TAD ברורים יותר – ה-TAD המכיל את מקדם Xist (Xist-TAD) מחולק בבירור לשני תחומים קטנים יותר (איור 6A, ראש חץ כחול). בעבר, ניתן היה "לנחש" זאת באופן חזותי רק מפרופיל 5C (איור 6B), אם כי זיהוי גבול באזור זה באמצעות אלגוריתם ציון הבידוד. כמו כן, הרזולוציה של פרופיל Capture Hi-C מאפשרת זיהוי של שני תחומים קטנים יותר ב-TAD השכן (איור 6A, B), המכיל את מקדם לוקוס Tsix (Tsix-TAD ); זה לא הושג קודם לכן עם 5C (איור 6B). יש לציין כי גבולות טופולוגיים הנקבעים על ידי ציון הבידוד מנתוני Capture Hi-C ו- 5C מזוהים בדרך כלל במקומות שונים במקצת ובעוצמות יחסיות שונות.
יתר על כן, מבנים תת-TAD אחרים כגון לולאות מגע נראים בבירור מנתוני Capture Hi-C, כגון הלולאה בין Xist ו-Ftx (איור 7A), שזוהתה בעבר עם Capture-C63, והלולאה בין Xist ל-Xert (איור 7B), שזוהתה לאחרונה באמצעות פרוטוקול דומה עבור Capture Hi-C48. אנשי קשר אחרים יכולים גם להיות ממופים בצורה מדויקת יותר הודות לרזולוציה המוגברת של פרופילי Capture Hi-C, כגון אלה שיוצרים את נקודות המגע החמות הידועות בתוך Tsix-TAD בין אתרי Linx, Chic1 ו-Xite (איור 7A).
בהשוואה לנתוני Hi-C המוצגים באיור 7, Capture Hi-C איפשר עלייה של פי ארבעה ברזולוציה, אך הוא דרש רק רבע מעומק הרצף (כלומר, 126 M קריאות לעומת 571 M) (טבלה משלימה 1). עלייה זו ברזולוציה מאפשרת זיהוי של תת-TADs ואינטראקציות לולאה שלא ניתן היה לזהות על-ידי Hi-C בעומק הרצף המוצג באיור 6 ובאיור 7. הפרוטוקול המתואר עבור Capture Hi-C מאפשר אפוא אפיון מפורט הרבה יותר, ברזולוציה גבוהה של אזור גנומי גדול של עניין, בהשוואה לגישות קודמות.
איור 1: תכנון החלושית. ייצוג סכמטי של האסטרטגיה המשמשת לתכנון הגשושית. אזורים של 300 bp במעלה ובמורד הזרם של כל אתר הגבלה DpnII על פני אזור היעד של 3 Mb נבחרו ורוצפו בבדיקות RNA חופפות ביוטינילציה. אחד מהאזורים שנבחרו אלה מוצג, chrX: 102,474,805-102,475,500. לא יותר מ-40 בסיסים של רצפים חוזרים מותרים בכל גשוש. אנא לחץ כאן כדי להציג גרסה גדולה יותר של איור זה.
איור 2: לכידת בקרות איכות קדם-ריצוף Hi-C . (A) דוגמה מייצגת לבקרות איכות של תבנית 3C. 200 ננוגרם של DNA הועמסו על ג'ל אגרוז 1%. נתיב 1: סולם 1 קילובייט. נתיב 2: כרומטין לא מעוכל, מוצלב ושלם פועל כרצועה חדה במהירות של >10 קילובייט. נתיב 3: כרומטין צולב מעוכל DpnII פועל ככתם בגודל שבין 1 KB ל -3 kb. נתיב 4: ספריית 3C סופית או תבנית; קצוות חופשיים של מקטעי דנ"א צולבים מעוכלים נקשרו מחדש. כתם הדנ"א בגודל מולקולרי נמוך יותר כמעט בלתי ניתן לגילוי, ותוצר הקשירה מזוהה כרצועה של >10 קילובייט. (B) דוגמאות מייצגות של פרופילי DNA של ביואנלייזר בעל רגישות גבוהה. משמאל למעלה: ספריית 3C שנחתכה בהצלחה ומציגה התפלגות של גודל הקטע בין 150 bp ל- 700 bp. מימין למעלה: ספריית 3C גזוז לא משביעת רצון. DNA לא גזוז מזוהה כהעשרה רחבה של מקטעים >2 קילובייט. (C) משמאל למטה: דגימת דנ"א גזורה לאחר בחירה בגודל צד שמאל ביחס של 1:1 באמצעות חרוזי SPRI. שברים של ~ 300 bp מועשרים. אמצע תחתון: פרופיל PCR טרום לכידה לאחר קשירה של מתאמים משויכים בהתאם לפרוטוקול היצרן. מימין למטה: ספריית Capture Hi-C סופית כולל מתאמים, ריצוף ופריימרים ליצירת אינדקס לריצוף מרובה. קיצורים: bp = זוגות בסיסים, FU = יחידת פלואורסצנטיות שרירותית. אנא לחץ כאן כדי להציג גרסה גדולה יותר של איור זה.
איור 3: לכוד בקרות איכות Hi-C לאחר ריצוף באמצעות HiC-Pro . (A) דוגמה לקצב מיפוי בגנום הייחוס עבור בן הזוג הראשון של זוגות הריצוף. החלק הכחול הבהיר מייצג את הקריאות המיושרות על ידי HiC-Pro ומתפרשות על פני צומת קשירה. לפיכך ניתן להשתמש במדד זה כדי לאמת את שלב הקשירה הניסיוני. (B) ברגע שבני זוג מרוצפים מיושרים על הגנום, רק זוגות קריאה מיושרים באופן ייחודי נשמרים לניתוח. (C) זוגות לא חוקיים (באדום) כגון קצה משתלשל, עיגול עצמי או קשירה מחדש נמחקים מהניתוח. שבר הזוגות החוקיים הוא אינדיקטור טוב ליעילות הקשירה והמשיכה כלפי מטה. (D) ניתן לחלק את הזוגות התקפים למגעים תוך-כרומוזומליים וקצרים/ארוכי טווח. זוגות קריאה משוכפלים שעשויים לייצג תוצרי PCR מושלכים מהניתוח. (E) עבור ניתוח ספציפי לאלל, HiC-Pro מדווח על מספר הקריאות האלליות הנתמכות על ידי בן זוג אחד או שניים עבור כל גנום הורי (כלומר, C57BL/6J x CASTEi/J). אותו חלק מהקריאות המוקצות לאלל האימהי והאבהי צפויות. (F) לבסוף, רק זוגות חוקיים החופפים לאזור הלכידה נבחרים לבניית מפות אנשי הקשר. זוגות לכידה-לכידה מייצגים אנשי קשר בתוך אזור היעד, בעוד שזוגות לכידה-מדווח כוללים אינטראקציה בין אזור היעד לאזור מחוץ ליעד. אנא לחץ כאן כדי להציג גרסה גדולה יותר של איור זה.
איור 4: זרימת עבודה של פרוטוקול Capture Hi-C. ייצוג סכמטי של שלבי פרוטוקול שונים. כדי ליצור את תבנית 3C רחבת הגנום, הכרומטין מוצלב תחילה עם פורמלדהיד ולאחר מכן מתעכל עם אנזים הגבלת DpnII. לאחר מכן קצוות דנ"א חופשיים נקשרים מחדש, הקישור הצולב מתהפך, והדנ"א מטוהר. כדי להעשיר מקטעים המקיפים את אזור המטרה, מערך של גשושיות RNA ביוטינילציה עובר הכלאה לתבנית 3C ונלכד על ידי משיכה בתיווך סטרפטווידין. ספריות לכידה מעובדות לריצוף מרובה, ומקטעי קשירה חוקיים מכומתים כדי להסיק את התדירות של מגעי הכרומטין על פני המטרה, המוצגים באופן חזותי כמפות אינטראקציה ברזולוציה גבוהה. אנא לחץ כאן כדי להציג גרסה גדולה יותר של איור זה.
איור 5: סקירה כללית של האזור שמקיף את ה-Xic בכרומוזום X של העכבר. ייצוג סכמטי של כרומוזום X של העכבר והגדלה של האזור שצולם 3 Mb (ChrX: 102,475,000-105,475,000). אזור היעד כולל ~ 800 KB של DNA המתאים ל - Xic, מוקד הבקרה הראשי של XCI. ה-Xic כולל את הגנים הארוכים שאינם מקודדים, את Xist, שחקן מפתח ב-XCI, ואת הנוף הרגולטורי שלו. רגולטורים חיוביים של Xist מוצגים בירוק, ורגולטורים שליליים בסגול. אנא לחץ כאן כדי להציג גרסה גדולה יותר של איור זה.
איור 6: לכוד מפות אינטראקציה של Hi-C, 5C ו- Hi-C ברחבי האזור שצולם ב- 3 Mb. (A) צלם מפת אינטראקציה Hi-C של היעד בגודל 3 Mb המקיף את העכבר Xic ברזולוציה של 10 KB (מחקר זה). (B) מפת אינטראקציה 5C של אותו אזור יעד כמו ב- A ברזולוציה של 6 KB (הנתונים עובדו מחדש מ-47). אזורים חוזרים שאינם נכללים בניתוחים מוסווים בלבן. נתוני 5C דורשים עיבוד ביואינפורמטי משלהם (ראה47). לאחר ניקוי ויישור, מפות 5C ברזולוציית פריימר מאוגדות באמצעות חציון פועל (חלון = 30 kb, שלב = 5) כדי להגיע לרזולוציה סופית של 6 kb. (C) מפת אינטראקציה Hi-C של אותו אזור גנומי כמו ב-A וב-B ברזולוציה של 40 KB (הנתונים עובדו מחדשמ-64). כל מפות האינטראקציה נוצרו מתאי גזע עובריים של עכברים. ציון הבידוד חושב באמצעות cooltools והוא מיוצג כהיסטוגרמות עם מינימום בידוד בגבולות TAD. גבולות TAD מוצגים כקווים אנכיים מתחת למפה. גובהו של כל קו מציין חוזק גבול. גנים מוצגים כחצים המצביעים לכיוון השעתוק. גבולות Sub-TAD המזוהים באופן בלעדי או מדויק יותר במפות Capture Hi-C מסומנים על ידי מגנטה וראשי חץ כחולים עבור תת-TADs ב- Tsix ו- Xist TADs, בהתאמה. אנא לחץ כאן כדי להציג גרסה גדולה יותר של איור זה.
איור 7: לכוד מפות אינטראקציה של Hi-C, 5C ו- Hi-C על פני 1 Mb בתוך האזור שנלכד. (A) לכוד מפת אינטראקציה Hi-C של האזור הגנומי של 1 Mb המקיף את העכבר Xic ברזולוציה של 5 KB (מחקר זה). (B) מפת אינטראקציה 5C של אותו אזור גנומי כמו ב-A. ברזולוציה של 6 KB (הנתונים עובדו מחדש מ-47). אזורים חוזרים שאינם נכללים בניתוחים מוסווים בלבן. יש לציין כי נתוני 5C דורשים עיבוד ביואינפורמטי משלהם (ראה47). לאחר ניקוי ויישור, מפות 5C ברזולוציית פריימר מאוגדות באמצעות חציון פועל (חלון = 30 kb, שלב = 5) כדי להגיע לרזולוציה סופית של 6 kb. (C) מפת אינטראקציה Hi-C של אותו אזור גנומי כמו ב- A ו- B של Hi-C ברזולוציה של 20 KB (הנתונים עובדו מחדש מ-64). כל מפות האינטראקציה נוצרו מ-mESC. ציון הבידוד חושב באמצעות cooltools והוא מיוצג כהיסטוגרמות עם מינימום בידוד בגבולות TAD. גבולות TAD מוצגים כקווים אנכיים מתחת למפה. גובהו של כל קו מציין חוזק גבול. גנים מוצגים כחצים המצביעים על כיוון השעתוק. לולאות מגע המזוהות באופן בלעדי או מדויק יותר ב- Capture Hi-C מסומנות על ידי מגנטה וכוכביות כחולות עבור לולאות ב- Tsix ו- Xist TADs, בהתאמה. אנא לחץ כאן כדי להציג גרסה גדולה יותר של איור זה.
טבלה משלימה 1: סטטיסטיקה לאחר ריצוף עבור מערכי הנתונים המשמשים בכתב יד זה: Capture Hi-C (מחקר זה), Hi-C64 ו-5C47. אנא לחץ כאן כדי להוריד קובץ זה.
כאן אנו מתארים פרוטוקול Capture Hi-C מהיר וקל יחסית לאפיון ארגון מסדר גבוה יותר של אזורים גנומיים בגודל מגה-בסיס ברזולוציה של 5-10 קילובייט. Capture Hi-C שייך למשפחת טכנולוגיות Capture-C שנועדו להעשיר אינטראקציות כרומטין ממוקדות מתבניות 3C או Hi-C ברחבי הגנום. עד כה, הרוב הגדול של יישומי Capture-C נוצלו למיפוי מגעי כרומטין של אלמנטים רגולטוריים קטנים יחסית המפוזרים על פני הגנום כולו. בפרוטוקול Capture-C הראשון, נעשה שימוש במספר בדיקות RNA ביוטיניליות חופפות כדי ללכוד >400 מקדמים שנבחרו מראש בספריות 3C שהוכנו מתאי אריתרואידים31. אותה אסטרטגיה שופרה לאחר מכן ב-Next Generation (NG) וב-Nuclear Titrated (NuTi) Capture-C כדי להשיג פרופילי אינטראקציה ברזולוציה גבוהה של >8,000 מקדמים באמצעות פיתיונות DNA בודדים של 120 bp המתפרשים על פני אתרי הגבלה בודדים ושני סבבי לכידה עוקבים כדי למקסם את ההעשרה של מקטעי קשירה אינפורמטיביים32,40. אסטרטגיות אלה הובילו לדיסקציה תפקודית של אלמנטים הפועלים על ידי CIS בהקשרים רבים ושונים, כולל התפתחות עוברית עכבר, התמיינות תאים, השבתה של כרומוזום X ובקרה שגויה של גנים בתנאים פתולוגיים 46,63,65,66,67,68,69,70,71.
ב-Promoter Capture Hi-C (PCHi-C), >22,000 מקדמים מבוארים המכילים מקטעי הגבלה נמשכו מספריות Hi-C על ידי הכלאה של גשושיות RNA בודדות 120-mer biotinylated באחד או בשני הקצוות של מקטע ההגבלה 34,72. שיטה זו אפשרה דיסקציה של האינטראקטום של אלפי מקדמים במספר גדל במהירות של סוגי תאים, כולל תאי גזע עובריים של עכברים, תאי כבד עובריים ואדיפוציטים 34,35,72,73, אך גם קווי לימפובלסטואידים אנושיים, אבות המטופויטיים, קרטינוציטים אפידרמיסים ותאים פלוריפוטנטיים 37,74,75,76,77 .
בהשוואה לטכנולוגיות העשרת מטרות אלה, Capture Hi-C מכוון לאזורים גנומיים רציפים עד לקנה מידה מגה-בסיס, ובכך משתרע על פני TAD אחד או יותר ומקיף נופים רגולטוריים של גנים. כל אזור העניין חייב להיות מרוצף עם מערך של בדיקות biotinylated המקיף כל אתר הגבלה DpnII בתוך המטרה. ההכלאה של מערך הביוטינילציה לתבנית 3C, לכידה מבוססת סטרפטווידין לאחר מכן ועיבוד לריצוף מרובב מבוצעים באמצעות מערכת העשרת מטרה עבור ריצוף מרובב אילומינה Paired-End. הפרוטוקול כולו מהיר, מכיוון שניתן לבצע אותו תוך שבוע מהכנת ספריית 3C ועד לריצוף NGS, והוא דורש רק התאמות קלות ו / או פתרון בעיות ספציפי בהתאמה אישית.
הפרוטוקול מספק גם יתרונות בהשוואה לשיטות מבוססות 3C אחרות. כדי לקבל מפות אינטראקציה ברזולוציה של 5-10 קילו-בתים, רצפנו 100-120 M קריאות קצה. לשם השוואה, השתמשנו כאן במערך נתונים Hi-C של 571 M קריאות כדי להגיע לרזולוציה של 20 KB64 (GSM2053973), ולפחות מיליארד קריאות יידרשו כדי להגיע לרזולוציה של 5 KB עם Hi-C22 רחב כרומוזומים.
לכידת Hi-C כפי שנעשה בה שימוש במחקר הנוכחי מגיעה לרזולוציה גבוהה בהרבה מזו של 5C שפורסם בעבר בהתבסס על אנזים הגבלת חותך 6 bp47 (טבלה משלימה 1). חשוב לציין, האסטרטגיה שנועדה להעשיר ולהעצים אינטראקציות ממוקדות ב-5C אינה מאפשרת ניתוח ספציפי לאלל של אינטראקציות כרומטין. נהפוך הוא, ניתן למפות את נתוני Capture Hi-C באופן ספציפי, ולאפשר דיסקציה של נופים מבניים תלת-ממדיים של זוגות כרומוזומים הומולוגיים, למשל בתאים אנושיים או בקווי תאים היברידיים F1 הנגזרים מחציית זני עכברים שונים גנטית78. כדי ליצור מפות אינטראקציה ספציפיות ללכידת Hi-C ברזולוציה של 5 קילו-בתים, ריצפנו קריאות מותאמות של 150 bp כדי להגדיל את כיסוי SNP. גישות ספציפיות לאלל דומות יכולות להיות מיושמות על קווי תאים אנושיים, שעבורם הביאור של SNPs זמין22.
חשוב לציין, למרות ש- Capture Hi-C מבטיח בדרך כלל רזולוציה גבוהה תוך שיפור הסבירות של עלויות ריצוף, לייצור אוליגונוקלאוטידים ביוטינילטים בהתאמה אישית יש השפעה על העלות הכוללת של שיטה זו. לכן, הבחירה של שיטת 3C המתאימה ביותר תהיה שונה עבור יישומים שונים, ויהיה תלוי בשאלה הביולוגית כי הוא מטופל ואת הפתרון הנדרש, כמו גם את גודל האזור של עניין. פרוטוקולי Capture Hi-C אחרים שפותחו חולקים תכונות מפתח עם הפרוטוקול המתואר כאן. לדוגמה, אסטרטגיית Capture Hi-C יושמה כדי לאפיין ~ 50 kb עד 1 Mb אזורים גנומיים המשתרעים על פני וריאנטים לא מקודדים הקשורים לסיכון לסרטן השד וסרטן המעי הגס; בפרוטוקול זה, אזורי המטרה נשלפו מספריות Hi-C על ידי הכלאה של פיתיונות RNA של 120 מר המרצפות את אזורי המטרה בכיסוי פי 3 33,38,79. באופן דומה, HYbrid Capture Hi-C (Hi-C 2) שימש למיקוד אינטראקציות בתוך אזורי עניין של עד2 Mb80. בשני הפרוטוקולים, השימוש בתבנית Hi-C מועשרת עבור מקטעי קשירה שנמשכו כלפי מטה של ביוטין הגדיל את אחוז הקריאות האינפורמטיביות הכולל בהשוואה לפרוטוקול שלנו. לדוגמה, במערך הנתונים Hi-C שבו השתמשנו כאן להשוואה64 (GSM2053973), אחוז הזוגות התקפים לאחר הסרת כפילויות גבוה פי 4.8 מהזוגות החוקיים שהתקבלו ב- Capture Hi-C כמתואר באיור 3 ובטבלה משלימה 1. עם זאת, המשיכה הרצופה של מקטעים קשורים ביוטינילטים וגשושיות היברידיות הופכת את הפרוטוקול למורכב יותר באופן משמעותי וגוזל זמן רב, תוך הפחתת המורכבות של האזור שנלכד.
שיטה זמינה נוספת להעשרת תבניות 3C בבדיקות אריחים היא Tiled-C, אשר יושמה לחקר ארכיטקטורת הכרומטין ברזולוציה מרחבית וטמפורלית גבוהה במהלך התמיינות אריתרואידיםשל עכבר 43. ב-Tiled-C, פאנל של 70 bp biotinylated probes משמש להעשרת מגעים בתוך אזורים בקנה מידה גדול בשני סבבי לכידה רצופים כדי ליצור מפות ברזולוציה גבוהה מאוד של אינטראקציות ממוקדות 43,81. העשרת הלכידה הכפולה גם הופכת את הפרוטוקול לארוך ומורכב יותר בהשוואה ל- Capture Hi-C. עם זאת, בשונה מאסטרטגיות Capture-C המכוונות לאתרי הגבלה בודדים, ב- Tiled-C נראה כי הסבב השני של הלכידה אינו מגדיל באופן משמעותי את יעילות הלכידה, ולכן ניתן להשמיט אותו43. לבסוף, גישת ריצוף דומה המבוססת על אותה אסטרטגיית העשרת מטרה ששימשה במחקר זה יושמה על נתיחת נופים רגולטוריים הכוללים וריאנטים מבניים שתוארו בחולים עם מומים מולדים והונדסו מחדש בעכברים טרנסגניים41,42. במקרה זה, מערך הריצוף של הגשושיות תוכנן על פני המטרה כולה ולא בקרבת אתרי הגבלה DpnII41. אף על פי כן, עבודה זו הייתה מכרעת בהדגשת הרגישות והעוצמה של אסטרטגיה זו להשגת אפיון ברזולוציה גבוהה של אזורים גנומיים גדולים בהקשרים שונים41,42,48.
לסיכום, הפרוטוקול המתואר כאן מייצג אסטרטגיה קלה, חזקה ורבת עוצמה לאפיון תלת-ממדי ברזולוציה גבוהה של כל אזורי העניין הגנומיים. יישום גישה זו על מערכות מודל שונות, סוגי תאים, נופי כרומטינים מווסתים התפתחותית ובקרת גנים בתנאים בריאים ופתולוגיים עשוי להקל על הבנתנו את יחסי הגומלין והסיבתיות בין טופולוגיית הגנום לבין בקרת גנים, אחת השאלות הפתוחות הבסיסיות בתחום האפיגנטיקה. יתר על כן, יישום Capture Hi-C כדי למפות אינטראקציות ארוכות טווח וקיפול כרומטין מסדר גבוה יותר של וריאנטים בסיכון שזוהו על ידי מחקרי GWAS יש פוטנציאל לחשוף את הרלוונטיות הפונקציונלית של אתרים גנומיים לא מקודדים הקשורים למחלות אנושיות בהקשרים שונים, ובכך לספק תובנות חדשות על התהליכים שעשויים להיות בבסיס הפתוגנזה.
קאי האושולץ הוא מדען יישומי שטח בקבוצת Agilent Technologies - Diagnostic and Genomics. כל שאר המחברים מצהירים שאין אינטרסים מתחרים.
העבודה במעבדת הרד נתמכה על ידי פרס החוקר המתקדם של מועצת המחקר האירופית (XPRESS - AdG671027). א.ל. נתמכת על ידי מלגת מארי סקלודובסקה-קירי לפעולות אינדיבידואליות של האיחוד האירופי (IF-838408). A.H. נתמכת על ידי הרשת החדשנית והבינתחומית של ITN ChromDesign, במסגרת הסכם מענק מארי סקלודובסקה-קירי 813327. המחברים מודים לדניאל איברהים (MPI לגנטיקה מולקולרית, ברלין) על ייעוץ טכני מועיל, לפלטפורמת NGS במכון קירי (פריז), ולוולדימיר בנס ולמתקן הליבה הגנומית ב- EMBL (היידלברג), על התמיכה והסיוע.
Name | Company | Catalog Number | Comments |
10x PBS pH 7.4 | Gibco | 10010-023 | |
37% (vol/vol) paraformaldehyde solution | Electron Microscopy Sciences | 15686 | single use glass-vials; do not reuse |
50 mL PP conical tube | Falcon | 352070 | |
Agarose | Sigma | A9539-500g | |
Bioanalyzer | Agilent | G2939BA | |
Cell Scrapers - 25 cm Handle and 3.0 cm Blade | Falcon | 353089 | |
CHIR99021 | Axon Medchem BV | Axon 1386 | |
cOmplete Mini, Protease inhibitor cocktail (EDTA-free) | Merck | 11836170001 | |
Countess Cell Counting Chamber Slides | Invitrogen | C10228 | |
Countess II FL | Invitrogen | ZGEXSCCOUNTESS2FL | Automated cell counter |
Covaris S2 | Covaris | 500217 | Sonicator |
DNA LoBind tube, 1.5 mL | Eppendorf | 30108051 | |
DpnII (50000 units/mL) | New England Biolabs | R0543M | |
Dulbecco's Modified Eagle Medium (DMEM) | Merck | D6429 | |
Ethanol (100%) | Merck | 1.00983.2500 | |
Fetal Bovine Serum (FBS) | Thermo Scientific | 10270106 | |
gelatine from porcine skin | Sigma | G1890 | |
GeneRuler 1 kb Plus DNA Ladder | Thermo Scientific | SM0313 | |
GlycoBlue | Thermo Scientific | AM9516 | Coprecipitant |
High-Sensitivity Bioanlayzer chips | Agilent | 5067-4626 | |
Large Cooling Centrifuge 5920 R | Eppendorf | 5948000018 | |
leukaemia inhibitory factor (LIF) | Merck | ESG1107 | |
Liquiport | KNF | NF300 | Benchtop aspiration system |
Low-binding filter tips | Biozym | VT0260U, VT0240, VT0220, VT0200U | |
Molecular biology grade water | Merck | W3500-6x500ML | |
Next Seq 500 | Illumina | SY-415-1001 | |
Next Seq 500 High Output v2 Kit (300 cycles) | Illumina | FC-404-2004 | |
Nonidet P40 Substitute (NP40) | Merck | 11332473001 | |
PD0325901 | Axon Medchem BV | Axon 1408 | |
Protease inhibitor cocktail (EDTA-free) | Merck | 11873580001 | |
Proteinase K - recombinant, PCR-grade (20 mg/mL) | Thermo Scientific | EO0491 | |
Qubit 2.0 | Thermo Scientific | Q32871 | |
Qubit assay tubes | Thermo Scientific | Q32856 | |
Qubit dsDNA High Sensitivity kit | Thermo Scientific | Q32851 | |
RNase A (10 mg/mL) | Thermo Scientific | EN0531 | |
Sodium acetate pH 5.2 (3M) | Merck | S7899 | |
speed vacuum concentrator | Eppendorf | EP5305000100-1EA | |
Agencourt AMPureXP | Beckman Coulter | A63881 | SPRI beads |
SureSelect Target Enrichment Box 1 | Agilent | 5190-8645 | |
SureSelect Target Enrichment Kit ILM Indexing Hyb Module Box 2 | Agilent | 5190-4455 | |
SureSelect XT Library Prep Kit ILM | Agilent | 5500-0132 | |
T4 ligase (30 units/µL) | Thermo Scientific | EL0013 | |
table-top Centrifuge 5427 R | Eppendorf | 5409000012 | |
Triton-X-100 (500 mL) | Merck | X100-500ML | |
Trypan Blue | Invitrogen | T10282 | |
Trypsine | Thermo Scientific | 25300054 | |
UltraPure Glycine | Thermo Scientific | 15527013 | |
β-mercaptoethanol | Thermo Scientific | 31350010 |
Request permission to reuse the text or figures of this JoVE article
Request PermissionThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. All rights reserved