Method Article
يصف هذا البروتوكول طريقة Capture Hi-C المستخدمة لتوصيف تنظيم 3D للمناطق الجينومية المستهدفة ذات الحجم الضخم بدقة عالية ، بما في ذلك حدود المجالات المرتبطة طوبولوجيا (TADs) وتفاعلات الكروماتين طويلة المدى بين عناصر تسلسل الحمض النووي التنظيمية وغيرها.
يساهم التنظيم المكاني للجينوم في وظيفته وتنظيمه في العديد من السياقات ، بما في ذلك النسخ والتكرار وإعادة التركيب والإصلاح. لذلك فإن فهم السببية الدقيقة بين طوبولوجيا الجينوم ووظيفته أمر بالغ الأهمية وموضوع بحث مكثف بشكل متزايد. تسمح تقنيات التقاط تشكل الكروموسوم (3C) باستنتاج البنية ثلاثية الأبعاد للكروماتين عن طريق قياس تواتر التفاعلات بين أي منطقة من الجينوم. نصف هنا بروتوكولا سريعا وبسيطا لأداء Capture Hi-C ، وهي طريقة تخصيب مستهدفة قائمة على 3C تميز التنظيم ثلاثي الأبعاد الخاص بالأليل للأهداف الجينومية الضخمة الحجم بدقة عالية. في Capture Hi-C ، يتم التقاط المناطق المستهدفة بواسطة مجموعة من مجسات البيوتينيل قبل تسلسل عالي الإنتاجية في المصب. وبالتالي ، يتم تحقيق دقة أعلى وخصوصية الأليل مع تحسين فعالية الوقت والقدرة على تحمل تكاليف التكنولوجيا. لإثبات نقاط قوته ، تم تطبيق بروتوكول Capture Hi-C على مركز تعطيل X للماوس (Xic) ، وهو الموضع التنظيمي الرئيسي لتعطيل كروموسوم X (XCI).
يحتوي الجينوم الخطي على جميع المعلومات اللازمة للكائن الحي للخضوع للتطور الجنيني والبقاء على قيد الحياة طوال مرحلة البلوغ. ومع ذلك ، فإن توجيه الخلايا المتطابقة وراثيا لأداء وظائف مختلفة أمر أساسي للتحكم بدقة في المعلومات المستخدمة في سياقات محددة ، بما في ذلك الأنسجة المختلفة و / أو مراحل النمو. يعتقد أن التنظيم ثلاثي الأبعاد للجينوم يشارك في هذا التنظيم المكاني الزماني الدقيق لنشاط الجينات من خلال تسهيل أو منع التفاعل المادي بين العناصر التنظيمية التي يمكن فصلها بعدة مئات من الكيلوباسات في الجينوم الخطي (للمراجعات1،2،3). في السنوات ال 20 الماضية ، زاد فهمنا للتفاعل بين طي الجينوم والنشاط بسرعة ، ويرجع ذلك إلى حد كبير إلى تطوير تقنيات التقاط تشكل الكروموسوم (3C) (للمراجعة4،5،6،7). تقيس هذه الطرق تواتر التفاعلات بين أي مناطق من الجينوم وتعتمد على ربط تسلسل الحمض النووي الذي يقع على مقربة من 3D داخل النواة. تبدأ بروتوكولات 3C الأكثر شيوعا بتثبيت مجموعات الخلايا بعامل ربط متقاطع مثل الفورمالديهايد. ثم يتم هضم الكروماتين المتصالب بإنزيم تقييد ، على الرغم من استخدام هضم MNase أيضا 8,9. بعد الهضم ، يتم إعادة ربط نهايات الحمض النووي الحرة على مقربة مكانية ، ويتم عكس الارتباط المتقاطع. تؤدي هذه الخطوة إلى ظهور "مكتبة" أو "قالب" 3C ، وهي مجموعة مختلطة من الأجزاء الهجينة التي يكون فيها للتسلسلات التي كانت قريبة من النواة فرص أكبر للارتباط في نفس جزء الحمض النووي. يتيح القياس الكمي لهذه الأجزاء الهجينة استنتاج التشكل ثلاثي الأبعاد للمناطق الجينومية التي تقع على بعد آلاف أزواج القواعد في الجينوم الخطي ولكنها قد تتفاعل في الفضاء ثلاثي الأبعاد.
تم تطوير العديد من الأساليب المختلفة لتوصيف مكتبة 3C ، والتي تختلف من حيث المجموعات الفرعية من شظايا الربط التي يتم تحليلها والتكنولوجيا المستخدمة في قياسها الكمي. اعتمد بروتوكول 3C الأصلي على اختيار منطقتين من الاهتمام والقياس الكمي لتردد التفاعل "واحد مقابل واحد" بواسطة PCR10,11. يقيس نهج 4C (التقاط التشكل الدائري للكروموسومات) التفاعلات بين موضع اهتمام واحد (أي "وجهة نظر") وبقية الجينوم ("واحد مقابل الكل")12،13،14. في 4C ، تخضع مكتبة 3C لجولة ثانية من الهضم وإعادة الربط لتوليد جزيئات الحمض النووي الدائرية الصغيرة التي يتم تضخيمها بواسطة مشغلات أولية محددة لنقطةالعرض 15. يتيح 5C (نسخة الكربون لالتقاط الكروموسومات) توصيف التفاعلات ثلاثية الأبعاد عبر مناطق الاهتمام الأكبر ، مما يوفر رؤى حول طي الكروماتين عالي الترتيب داخل تلك المنطقة ("كثير مقابل كثير")16. في 5C ، يتم تهجين مكتبة 3C إلى مجموعة من oligonucleotides مواقع تقييد متداخلة يمكن تضخيمها لاحقا بواسطة تفاعل البوليميراز المتسلسل المتعدد مع الاشعال العالمية15. في كل من 4C و 5C ، تم تحديد شظايا الحمض النووي المفيدة في البداية بواسطة المصفوفات الدقيقة وبعد ذلك بواسطة تسلسل الجيل التالي (NGS) 17،18،19. تميز هذه الاستراتيجيات مناطق الاهتمام المستهدفة ولكن لا يمكن تطبيقها لرسم خريطة التفاعلات على مستوى الجينوم. يتم تحقيق هذا الهدف الأخير باستخدام Hi-C ، وهي استراتيجية عالية الإنتاجية قائمة على 3C يسمح فيها التسلسل المتوازي بشكل كبير لقالب 3C بالتوصيف غير المتحيز لطي الكروماتين على مستوى الجينوم ("الكل مقابل الكل") 20. يتضمن بروتوكول Hi-C دمج بقايا البيوتينيل في نهايات الشظايا المهضومة ، والتي يتبعها سحب شظايا الربط مع حبات الستربتافيدين لزيادة استعادة الشظايا المربوطة20.
كشف Hi-C أن جينومات الثدييات منظمة هيكليا على مستويات متعددة في نواة 3D. على نطاق megabase ، ينقسم الجينوم إلى مناطق من الكروماتين النشط وغير النشط ، المقصورات A و B ، على التوالي20,21. كما تبين لاحقا وجود المزيد من الأجزاء الفرعية التي تمثلها حالات مختلفة من الكروماتين والنشاط22. في دقة أعلى ، يتم تقسيم الجينوم إلى مجالات ذاتية التفاعل شبه ضخمة تسمى مجالات الارتباط الطوبولوجي (TADs) ، والتي تم الكشف عنها لأول مرة من خلال تحليل Hi-C و 5C للجينومات البشرية والفأر23,24. على عكس المقصورات التي تختلف بطريقة خاصة بالأنسجة ، تميل TADs إلى أن تكون ثابتة (على الرغم من وجود العديد من الاستثناءات). الأهم من ذلك ، يتم الحفاظ على حدود TAD عبر الأنواع25. في خلايا الثدييات ، غالبا ما تشمل TADs الجينات التي تشترك في نفس المشهد التنظيمي وقد ثبت أنها تمثل إطارا هيكليا يسهل التنظيم المشترك للجينات مع الحد من التفاعلات مع المجالات التنظيمية المجاورة (للمراجعة3،26،27،28). علاوة على ذلك ، داخل TADs ، قد تزيد التفاعلات الناتجة عن مواقع CTCF في قاعدة الحلقات المبثوقة من التماسك من احتمال تفاعلات المروج والمحسن أو المحسن (للمراجعة29).
في Hi-C ، يمكن اكتشاف المقصورات و TADs بدقة 1 ميجا بايت إلى 40 كيلو بايت ، ولكن يمكن تحقيق دقة أعلى لتوصيف جهات الاتصال الأصغر حجما مثل تفاعلات الحلقات بين العناصر البعيدة بمقياس 5-10 كيلو بايت. ومع ذلك ، فإن زيادة الدقة لتكون قادرة على اكتشاف مثل هذه الحلقات بكفاءة بواسطة HiC تتطلب زيادة كبيرة في عمق التسلسل ، وبالتالي تكاليف التسلسل. يتفاقم هذا إذا كان التحليل يحتاج إلى أن يكون خاصا بالأليل. في الواقع ، تتطلب زيادة الدقة بمقدار X أضعاف زيادة X2 في عمق التسلسل ، مما يعني أن الأساليب عالية الدقة والخاصة بالجينوم على مستوى الأليل يمكن أن تكون باهظةالتكلفة 30.
لتحسين فعالية التكلفة والقدرة على تحمل التكاليف مع الحفاظ على دقة عالية ، يمكن سحب المناطق المستهدفة ذات الأهمية فعليا من مكتبات 3C أو Hi-C على مستوى الجينوم بعد تهجينها مع مجسات oligonucleotide التكميلية التي تحمل علامة البيوتين قبل تسلسل المصب. يشار إلى استراتيجيات التخصيب المستهدفة هذه باسم طرق Capture-C وتسمح باستجواب تفاعلات مئات المواقع المستهدفة المنتشرة عبر الجينوم (أي التقاط المروج (PC) Hi-C ؛ الجيل التالي (NG) Capture-C ؛ الإدخال المنخفض (LI) Capture-C ؛ المعايرة النووية (NuTi) Capture-C ؛ Tri-C)31,32,33,34,35,36,37,38,39,40، أو عبر المناطق التي تمتد حتى عدة قواعد ضخمة (أي التقاط HiC؛ HYbrid التقاط Hi-C (Hi-C2) ؛ البلاط-C)41،42،43. يمكن أن يختلف جانبان في الأساليب القائمة على الالتقاط: (1) طبيعة وتصميم قليل النيوكليوتيدات البيوتينيلاتي (أي الحمض النووي الريبي أو الحمض النووي ، أو أوليغوس مفرد يلتقط أهدافا جينومية مشتتة أو أوليغو متعددة تبليط منطقة ذات أهمية) ؛ (2) طبيعة وتصميم أوليغونيوكليوتيدات البيوتينيل (أي الحمض النووي الريبي أو الحمض النووي ، أو أوليغوس مفرد يلتقط أهدافا جينومية مشتتة أو أوليغو متعددة تبليط منطقة ذات أهمية) ؛ (2) طبيعة وتصميم أوليغوكليوتيدات البيوتينيل (أي الحمض النووي الريبي أو الحمض النووي ، أو أوليغوس مفرد يلتقط أهدافا جينومية مشتتة أو أوليغو متعددة تبليط منطقة ذات أهمية) ؛ (2) طبيعة وتصميم أوليغوكليوتيدات البيوتينيل ( و (2) القالب المستخدم لسحب الأهداف التي يمكن أن تكون مكتبة 3C أو Hi-C ، وتتكون الأخيرة من شظايا تقييد البيوتينيلات المسحوبة لأسفل من مكتبة 3C.
هنا ، يتم وصف بروتوكول Capture Hi-C استنادا إلى إثراء جهات الاتصال المستهدفة من مكتبة 3C. يعتمد البروتوكول على تصميم مجموعة تبليط مصممة خصيصا من مجسات الحمض النووي الريبي البيوتينيلاتي ويمكن إجراؤها في أسبوع 1 من إعداد مكتبة 3C إلى تسلسل NGS. البروتوكول سريع وبسيط ويسمح بتوصيف التنظيم ثلاثي الأبعاد الأعلى مرتبة للمناطق ذات الحجم الضخم ذات الأهمية بدقة 5 كيلوبايت مع تحسين فعالية الوقت والقدرة على تحمل التكاليف مقارنة بطرق 3C الأخرى. تم تطبيق بروتوكول Capture Hi-C على الموضع التنظيمي الرئيسي لتعطيل الكروموسوم X (XCI) ، ومركز تعطيل X (Xic) ، الذي يستضيف الحمض النووي الريبي غير المشفر Xist. كان Xic سابقا موضوع تحليلات هيكلية ووظيفية واسعة النطاق (للمراجعة44،45). في الثدييات ، يعوض XCI عن جرعة الجينات المرتبطة بالكروموسوم X بين الإناث (XX) والذكور (XY) ويتضمن إسكات النسخ لكامل أحد كروموسومي X تقريبا في الخلايا الأنثوية. يمثل Xic موقعا قياسيا ذهبيا قويا للدراسات في طوبولوجيا الجينوم 3D والتفاعل مع تنظيم الجينات44. أدى تحليل 5C ل Xic في الخلايا الجذعية الجنينية للفأر (mESCs) إلى اكتشاف وتسمية TADs ، مما يوفر أول رؤى حول الأهمية الوظيفية للتقسيم الطوبولوجي والتنظيم المشترك للجينات24. تبين لاحقا أن التنظيم الطوبولوجي ل Xic متورط بشكل حاسم في التوقيت التنموي المناسب لتنظيم Xist و XCI 46 ، كما تم اكتشاف عناصر تنظيمية غير متوقعة يمكن أن تؤثر على نشاط الجينات داخل وبين TADs مؤخرا داخل Xic47،48،49. يوضح تطبيق Capture Hi-C على 3 ميجا بايت من كروموسوم X للفأر الذي يمتد عبر Xic قوة هذا النهج في تشريح طي الكروماتين على نطاق واسع بدقة عالية. يتم توفير بروتوكول مفصل وسهل المتابعة ، بدءا من تصميم مجموعة مجسات البيوتينيلات عبر كل موقع تقييد DpnII داخل المنطقة ذات الاهتمام إلى إنشاء مكتبة 3C على مستوى الجينوم ، والتهجين والتقاط جهات الاتصال المستهدفة ، وتحليل البيانات النهائية. كما يتضمن لمحة عامة عن ضوابط الجودة المناسبة والنتائج المتوقعة، وتناقش نقاط القوة والقصور في النهج في ضوء الأساليب الحالية المماثلة.
تم اشتقاق الخلايا الجذعية الجنينية للفأر (mESCs) المستخدمة في هذه الدراسة من صليب أنثى TX / TX R26 rtTA/ rtTA 50 مع ذكر Mus musculus castaneus وفقا لإرشادات رعاية الحيوان لمعهد كوري (باريس) 51.
1. تصميم التحقيق
2. الإجراء التجريبي
3. تحليل البيانات
يعتمد بروتوكول Capture Hi-C الموصوف على إعداد قالب 3C على مستوى الجينوم باستخدام قاطع رباعي القواعد (DpnII). يتم الحصول على الإثراء اللاحق لشظايا الربط عبر المنطقة الجينومية ذات الأهمية عن طريق تهجين مجموعة من مجسات الحمض النووي الريبي التبليطية والتقاطها القائم على الستربتافيدين وفقا لنظام التخصيب المستهدف المستخدم في هذه الدراسة (الشكل 1). تم اختيار مجسات الحمض النووي الريبي البيوتينيلية لأنها تظهر تقاربا أكثر إحكاما لأهدافها مقارنة بمجسات الحمض النووي52,60. ثم يتم فهرسة المكتبات التي تم التقاطها وتجميعها من أجل تسلسل متعدد الإنتاجية عالي الإنتاجية. يمكن تصور بيانات التقاط Hi-C كخرائط تفاعل Hi-C عالية الدقة ولكن أيضا كخرائط اتصال أحادية نقطة عرض تشبه 4C لتصور تفاعلات التسلسلات الأصغر على وجه التحديد مثل المروجين أو المعززات داخل المنطقة الملتقطة بأكملها. يظهر سير عمل البروتوكول في الشكل 4. يتم عرض ضوابط جودة التسلسل المسبق في الشكل 2 وتشمل تقييم الهضم السليم وإعادة ربط قالب 3C والقص والتنقية الفعالة عبر الخطوات المختلفة للبروتوكول. من المتوقع أن يعمل الحمض النووي لقالب 3C المقطوع بين 150 إلى 700 نقطة أساس ، ولا ينبغي الكشف عن أي إثراء للشظايا >2 كيلو بايت. خلال الخطوات التالية ، يتم تنفيذ العديد من خطوات تنظيف الحمض النووي القائمة على الخرزة واختيار الحجم ، أولا بعد القص ، ثم بعد PCRs قبل الالتقاط وما بعد الالتقاط. تظهر المكتبات التي تم تنظيفها ملف تعريف إثراء شظية مميز كما هو موضح في محلل حيوي عالي الحساسية للحمض النووي (الشكل 2). يزداد متوسط حجم الجزء على مدار إعداد المكتبة بسبب ربط المحولات والتسلسل وفهرسة البادئات. يتم الحصول على ضوابط الجودة بعد التسلسل عبر Hi-C Pro وتظهر في الشكل 3. تم اقتراح العديد من تطبيقات برامج المعلوماتية الحيوية المختلفة لمعالجة وتحليل البيانات الشبيهة ب 3C. من بينها ، يعد خط أنابيب HiC-Pro أحد أكثر الحلول شيوعا ، مما يسمح بمعالجة بيانات التسلسل الخام إلى خرائط الاتصال النهائية بدقةمختلفة 55. يستخدم HiC-Pro استراتيجية رسم خرائط من خطوتين لمحاذاة قراءات التسلسل على الجينوم المرجعي. ثم يتم إعادة بناء منتجات 3C وتصفيتها لإزالة أزواج الاتصال غير المفيدة وإنشاء خرائط الاتصال. بالإضافة إلى ذلك ، فإنه قادر على استخدام قائمة من الأشكال المتعددة المعروفة لإجراء تحليل خاص بالأليل وفصل جهات الاتصال القادمة من الأليلين الأبويين في خرائط اتصال متميزة. في الآونة الأخيرة ، تم تضمين HiC-Pro وتوسيعه في إطار عمل nf-core (nf-core-hic) ، مما يوفر خط أنابيب مدفوعا بالمجتمع قابل للتطوير وقابل للتكراربدرجة كبيرة 61,62.
لالتقاط الفأر Xic ، تم تصميم مجموعة من 28,913 مسبار RNA تبليط 3 ميجا بايت من كروموسوم X. تتضمن هذه المنطقة اللاعب الرئيسي في XCI ، الجين الطويل غير المشفر Xist ، والمشهد التنظيمي المعروف ~ 800 كيلو بايت (الشكل 5). تنقسم هذه المنطقة ~ 800 كيلو بايت إلى اثنين من TADs: أحدهما يتضمن مروج Xist ومنظماته الإيجابية المعروفة (أي النصوص غير المشفرة Ftx و Jpx و Xert والجين المشفر للبروتين Rnf12) ، و TAD المجاور الذي يشمل منظمات رابطة الدول المستقلة السلبية ل Xist (أي نسخته المضادة للمعنى Tsix ، وعنصر المحسن Xite ، والنص غير المشفر Linx) (للمراجعة 44 ، 45).
من خلال تطبيق بروتوكول Capture Hi-C الموصوف على Xic ، تم الحصول على التنظيم الطوبولوجي لهذا الموضع بدقة غير مسبوقة (الشكل 6 والشكل 7). هذا واضح بشكل خاص عند مقارنة ملف تعريف Capture Hi-C ب 5C47 المنشور مسبقا (الشكل 6 والشكل 7 ؛ الجدول التكميلي 1) و Hi-C61 (الشكل 6 والشكل 7 ؛ الجدول التكميلي 1) ملفات تعريف. على سبيل المثال ، تكون هياكل TAD الفرعية أكثر وضوحا - من الواضح أن TAD الذي يحتوي على مروج Xist (Xist-TAD) ينقسم إلى مجالين أصغر (الشكل 6A ، رأس السهم الأزرق). في السابق ، كان من الممكن "تخمين" هذا بصريا فقط من ملف تعريف 5C (الشكل 6B) ، وإن كان اكتشاف حدود في هذه المنطقة باستخدام خوارزمية درجة العزل. وبالمثل ، فإن دقة ملف تعريف Capture Hi-C تسمح بتحديد مجالين أصغر في TAD المجاور (الشكل 6A ، B) ، والذي يحتوي على مروج موضع Tsix ( Tsix-TAD ) ؛ لم يتحقق ذلك من قبل مع 5C (الشكل 6B). وتجدر الإشارة إلى أن الحدود الطوبولوجية التي تحددها درجة العزل من بيانات Capture Hi-C و 5C يتم اكتشافها بشكل عام في مواقع مختلفة قليلا وبقوة نسبية مختلفة.
علاوة على ذلك ، فإن هياكل TAD الفرعية الأخرى مثل حلقات الاتصال مرئية بوضوح من بيانات Capture Hi-C ، مثل الحلقة بين Xist و Ftx (الشكل 7A) ، التي تم تحديدها مسبقا مع Capture-C63 ، والحلقة بين Xist و Xert (الشكل 7B) ، تم تحديدها مؤخرا باستخدام بروتوكول مماثل ل Capture Hi-C48. يمكن أيضا تعيين جهات الاتصال الأخرى بشكل أكثر دقة بسبب زيادة دقة ملفات تعريف Capture Hi-C ، مثل تلك التي تشكل نقاط الاتصال المعروفة داخل Tsix-TAD بين مواقع Linx و Chic1 و Xite (الشكل 7A).
بالمقارنة مع بيانات Hi-C الموضحة في الشكل 7 ، سمح Capture Hi-C بزيادة أربعة أضعاف في الدقة ، ومع ذلك فقد تطلب فقط ربع عمق التسلسل (أي 126 M يقرأ مقابل 571 M) (الجدول التكميلي 1). تسمح هذه الزيادة في الدقة باكتشاف subTADs وتفاعلات الحلقات التي لا يمكن اكتشافها بواسطة Hi-C عند عمق التسلسل الموضح في الشكل 6 والشكل 7. وبالتالي ، فإن البروتوكول الموصوف ل Capture Hi-C يسمح بتوصيف أكثر تفصيلا وعالي الدقة لمنطقة جينومية كبيرة ذات أهمية ، مقارنة بالأساليب السابقة.
الشكل 1: تصميم المسبار. تمثيل تخطيطي للاستراتيجية المستخدمة لتصميم المسبار. تم اختيار مناطق 300 نقطة أساس في المنبع والمصب لكل موقع تقييد DpnII عبر المنطقة المستهدفة 3 ميجا بايت وتم تبليطها بمجسات الحمض النووي الريبي البيوتينيلية المتداخلة. تظهر إحدى هذه المناطق المحددة، chrX: 102,474,805-102,475,500. لا يسمح بأكثر من 40 قاعدة من التسلسلات المتكررة في كل مسبار. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.
الشكل 2: التقاط ضوابط جودة التسلسل المسبق Hi-C . (أ) مثال تمثيلي لضوابط جودة قالب 3C. تم تحميل 200 نانوغرام من الحمض النووي على هلام أغاروز 1٪. حارة 1: 1 كيلو بايت سلم. الحارة 2: يعمل الكروماتين غير المهضوم والمتشابك والسليم كشريط حاد عند >10 كيلو بايت. الحارة 3: يعمل الكروماتين المتصالب المهضوم DpnII كمسحة يتراوح حجمها بين 1 كيلو بايت إلى 3 كيلو بايت. الحارة 4: مكتبة أو قالب 3C النهائي ؛ يتم إعادة ربط الأطراف الحرة لشظايا الحمض النووي المتشابكة المهضومة. لا يمكن اكتشاف مسحة الحمض النووي ذات الحجم الجزيئي المنخفض تقريبا ، ويتم اكتشاف منتج الربط كنطاق >10 كيلو بايت. (ب) أمثلة تمثيلية لملامح الحمض النووي للمحلل الحيوي عالي الحساسية. أعلى اليسار: مكتبة 3C تم قصها بنجاح تظهر توزيعا لحجم الجزء بين 150 نقطة أساس و 700 نقطة أساس. أعلى اليمين: مكتبة 3C غير مرضية. تم الكشف عن الحمض النووي غير المقطوع على أنه إثراء واسع للشظايا >2 كيلو بايت. (ج) أسفل اليسار: عينة الحمض النووي المنفصمة بعد اختيار حجم الجانب الأيسر 1: 1 باستخدام حبات SPRI. يتم إثراء شظايا ~ 300 bp. الوسط السفلي: ملف تعريف PCR قبل الالتقاط بعد ربط المحولات ذات النهاية المزدوجة وفقا لبروتوكول الشركة المصنعة. أسفل اليمين: مكتبة Capture Hi-C النهائية بما في ذلك المحولات والتسلسل وبادئات الفهرسة للتسلسل متعدد الإرسال. الاختصارات: bp = أزواج القواعد ، FU = وحدة مضان تعسفية. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.
الشكل 3: التقاط ضوابط الجودة بعد التسلسل Hi-C باستخدام HiC-Pro . (أ) مثال على معدل رسم الخرائط على الجينوم المرجعي للرفيق الأول لأزواج التسلسل. يمثل الجزء الأزرق الفاتح القراءات المحاذية بواسطة HiC-Pro وتمتد عبر تقاطع ربط. وبالتالي يمكن استخدام هذا المقياس للتحقق من صحة خطوة الربط التجريبية. (ب) بمجرد محاذاة زملاء التسلسل على الجينوم ، يتم الاحتفاظ بأزواج القراءة المحاذاة بشكل فريد فقط للتحليل. (ج) يتم استبعاد الأزواج غير الصالحة (باللون الأحمر) مثل الطرف المتدلي أو الدائرة الذاتية أو إعادة الربط من التحليل. يعد جزء الأزواج الصالحة مؤشرا جيدا على كفاءة الربط والقائمة المنسدلة. (د) يمكن تقسيم الأزواج الصالحة إلى ملامسات داخل الكروموسومات وبينها وبين ملامسات قصيرة/طويلة المدى. يتم تجاهل أزواج القراءة المكررة التي من المحتمل أن تمثل عناصر تفاعل البوليميراز المتسلسل من التحليل. (ه) بالنسبة للتحليل الخاص بالأليل ، يبلغ HiC-Pro عن عدد القراءات الأليلية التي يدعمها إما واحد أو اثنين من الشركاء لكل جينوم أبوي (أي C57BL / 6J x CASTEi / J). من المتوقع نفس الجزء من القراءات المخصصة لأليل الأم والأب. (F) أخيرا ، يتم تحديد الأزواج الصالحة المتداخلة مع منطقة الالتقاط فقط لإنشاء خرائط الاتصال. تمثل أزواج الالتقاط والالتقاط جهات اتصال داخل المنطقة المستهدفة ، بينما تتضمن أزواج الالتقاط والمراسل التفاعل بين المنطقة المستهدفة والمنطقة خارج الهدف. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.
الشكل 4: سير عمل بروتوكول التقاط Hi-C. تمثيل تخطيطي لخطوات البروتوكول المختلفة. لإنشاء قالب 3C على مستوى الجينوم ، يتم ربط الكروماتين أولا بالفورمالديهايد ثم يتم هضمه باستخدام إنزيم تقييد DpnII. ثم يتم إعادة ربط نهايات الحمض النووي الحرة ، ويتم عكس الارتباط المتقاطع ، ويتم تنقية الحمض النووي. لإثراء الشظايا التي تشمل المنطقة المستهدفة ، يتم تهجين مجموعة من مجسات الحمض النووي الريبي البيوتينيلاتي إلى قالب 3C ويتم التقاطها بواسطة السحب بوساطة الستربتافيدين لأسفل. تتم معالجة مكتبات الالتقاط للتسلسل المتعدد ، ويتم تحديد أجزاء الربط الصالحة لاستنتاج تكرار اتصالات الكروماتين عبر الهدف ، والتي يتم تصورها كخرائط تفاعل عالية الدقة. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.
الشكل 5: نظرة عامة على المنطقة التي تضم Xic على كروموسوم X للفأر. تمثيل تخطيطي لكروموسوم الماوس X وتكبير المنطقة الملتقطة 3 ميجا بايت (ChrX: 102,475,000-105,475,000). تتضمن المنطقة المستهدفة ~ 800 كيلو بايت من الحمض النووي المقابل ل Xic ، الموضع التنظيمي الرئيسي ل XCI. يتضمن Xic الجينات الطويلة غير المشفرة ، Xist ، وهو لاعب رئيسي في XCI ، والمشهد التنظيمي. تظهر المنظمات الإيجابية ل Xist باللون الأخضر ، والمنظمين السالبين باللون الأرجواني. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.
الشكل 6: التقط خرائط تفاعل Hi-C و 5C و Hi-C عبر المنطقة الملتقطة 3 ميجا بايت. (أ) التقاط خريطة تفاعل Hi-C لهدف 3 ميجا بايت يشمل الماوس Xic بدقة 10 كيلو بايت (هذه الدراسة). (B) خريطة تفاعل 5C لنفس المنطقة المستهدفة كما في A بدقة 6 كيلو بايت (البيانات المعاد معالجتها من47). المناطق المتكررة غير المدرجة في التحليلات مقنعة باللون الأبيض. تتطلب بيانات 5C معالجة المعلوماتية الحيوية الخاصة بها (انظر47). بعد التنظيف والمحاذاة ، يتم تثبيت خرائط 5C بدقة التمهيدي باستخدام وسيط قيد التشغيل (نافذة = 30 كيلو بايت ، الخطوة = 5) للوصول إلى دقة نهائية تبلغ 6 كيلوبايت. (C) خريطة تفاعل Hi-C لنفس المنطقة الجينومية كما في A و B بدقة 40 كيلو بايت (البيانات المعاد معالجتها من64). تم إنشاء جميع خرائط التفاعل من ESCs الماوس. تم حساب درجة العزل باستخدام أدوات التبريد ويتم تمثيلها كرسوم بيانية مع الحد الأدنى للعزل عند حدود TAD. تظهر حدود TAD كخطوط عمودية أسفل الخريطة. يشير ارتفاع كل خط إلى قوة الحدود. تظهر الجينات في صورة أسهم تشير إلى اتجاه النسخ. تتم الإشارة إلى حدود TAD الفرعية التي يتم اكتشافها بشكل حصري أو أكثر دقة في خرائط Capture Hi-C بواسطة رؤوس الأسهم الأرجواني والأزرق ل TADs الفرعية في Tsix و Xist TADs ، على التوالي. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.
الشكل 7: التقط خرائط تفاعل Hi-C و 5C و Hi-C عبر 1 ميجا بايت داخل المنطقة الملتقطة. (أ) التقاط خريطة تفاعل Hi-C للمنطقة الجينومية 1 ميجا بايت التي تشمل الفأر Xic بدقة 5 كيلو بايت (هذه الدراسة). (ب) خريطة تفاعل 5C لنفس المنطقة الجينومية كما في A. بدقة 6 كيلوبايت (تمت إعادة معالجة البيانات من47). المناطق المتكررة غير المدرجة في التحليلات مقنعة باللون الأبيض. وتجدر الإشارة إلى أن بيانات 5C تتطلب معالجة المعلوماتية الحيوية الخاصة بها (انظر47). بعد التنظيف والمحاذاة ، يتم تثبيت خرائط 5C بدقة التمهيدي باستخدام وسيط قيد التشغيل (نافذة = 30 كيلو بايت ، الخطوة = 5) للوصول إلى دقة نهائية تبلغ 6 كيلوبايت. (C) خريطة تفاعل Hi-C لنفس المنطقة الجينومية كما في A و B من Hi-C بدقة 20 كيلو بايت (البيانات المعاد معالجتها من64). تم إنشاء جميع خرائط التفاعل من mESCs. تم حساب درجة العزل باستخدام أدوات التبريد ويتم تمثيلها كرسوم بيانية مع الحد الأدنى للعزل عند حدود TAD. تظهر حدود TAD كخطوط عمودية أسفل الخريطة. يشير ارتفاع كل خط إلى قوة الحدود. تظهر الجينات في صورة أسهم تشير إلى اتجاه النسخ. يشار إلى حلقات التلامس التي يتم اكتشافها بشكل حصري أو أكثر دقة في Capture Hi-C بعلامات نجمية أرجوانية وزرقاء للحلقات في Tsix و Xist TADs ، على التوالي. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.
الجدول التكميلي 1: إحصائيات ما بعد التسلسل لمجموعات البيانات المستخدمة في هذه المخطوطة: Capture Hi-C (هذه الدراسة) ، Hi-C64 ، و 5C47. الرجاء الضغط هنا لتنزيل هذا الملف.
هنا نصف بروتوكول Capture Hi-C السريع والسهل نسبيا لتوصيف التنظيم الأعلى ترتيبا للمناطق الجينومية ذات الحجم الضخم بدقة 5-10 كيلو بايت. ينتمي Capture Hi-C إلى عائلة تقنيات Capture-C المصممة لإثراء تفاعلات الكروماتين المستهدفة من قوالب 3C أو Hi-C على مستوى الجينوم. حتى الآن ، تم استغلال الغالبية العظمى من تطبيقات Capture-C لرسم خريطة لاتصالات الكروماتين للعناصر التنظيمية الصغيرة نسبيا المنتشرة عبر الجينوم بأكمله. في بروتوكول Capture-C الأول ، تم استخدام مجسات متعددة متداخلة من الحمض النووي الريبي الحيوي لالتقاط >400 تم اختيارهم مسبقا في مكتبات 3C المحضرة من خلايا الكريات الحمر31. تم تحسين نفس الاستراتيجية لاحقا في الجيل التالي (NG) والمعايرة النووية (NuTi) Capture-C لتحقيق ملفات تعريف تفاعل عالية الدقة ل >8000 مروج باستخدام طعوم DNA مفردة 120 bp تغطي مواقع تقييد فردية وجولتين متتاليتين من الالتقاط لزيادة إثراء شظايا الربط المعلوماتية إلى أقصى حد32,40. أدت هذه الاستراتيجيات إلى التشريح الوظيفي للعناصر التي تعمل في رابطة الدول المستقلة في العديد من السياقات المختلفة ، بما في ذلك التطور الجنيني للفأر ، وتمايز الخلايا ، وتعطيل الكروموسوم X ، وسوء تنظيم الجينات في الحالات المرضية 46،63،65،66،67،68،69،70،71.
في Promoter Capture Hi-C (PCHi-C) ، تم سحب > 22000 مشروح يحتوي على شظايا تقييد من مكتبات Hi-C عن طريق تهجين مجسات البيوتينيل أحادية الحمض النووي الريبي 120-mer في أي من طرفي جزء التقييد34,72 أو كلاهما. سمحت هذه الطريقة بتشريح تفاعل الآلاف من المروجين في عدد متزايد بسرعة من أنواع الخلايا ، بما في ذلك الخلايا الجذعية الجنينية للفأر ، وخلايا الكبد الجنينية ، والخلايا الشحمية 34،35،72،73 ، ولكن أيضا خطوط الأرومة اللمفاوية البشرية ، والأسلاف المكونة للدم ، والخلايا الكيراتينية للبشرة ، والخلايا متعددة القدرات37،74،75،76،77.
بالمقارنة مع تقنيات التخصيب المستهدفة هذه ، يستهدف Capture Hi-C المناطق الجينومية المتجاورة حتى النطاق الضخم ، وبالتالي يمتد على واحد أو أكثر من TADs ويشمل المناظر الطبيعية التنظيمية للجينات. يجب أن تكون المنطقة محل الاهتمام بأكملها مبلطة بمجموعة من مجسات البيوتينيلات التي تشمل كل موقع تقييد DpnII داخل الهدف. يتم إجراء تهجين المصفوفة البيوتينيلية إلى قالب 3C ، والتقاطها اللاحق القائم على الستربتافيدين ، ومعالجة التسلسل المتعدد الإرسال باستخدام نظام إثراء مستهدف لتسلسل Illumina Paired-End متعدد الإرسال. البروتوكول بأكمله سريع ، حيث يمكن إجراؤه في أسبوع 1 من إعداد مكتبة 3C إلى تسلسل NGS ، ولا يتطلب سوى تعديلات طفيفة و / أو استكشاف الأخطاء وإصلاحها حسب الطلب.
يوفر البروتوكول أيضا مزايا مقارنة بالطرق الأخرى المستندة إلى 3C. للحصول على خرائط التفاعل بدقة 5-10 كيلو بايت ، قمنا بتسلسل قراءات 100-120 M ذات النهاية الزوجية. على سبيل المقارنة ، استخدمنا هنا مجموعة بيانات Hi-C من 571 مليون قراءة للوصول إلى دقة 20 كيلو بايت64 (GSM2053973) ، وستكون هناك حاجة إلى 1 مليار قراءة على الأقل للوصول إلى دقة 5 كيلو بايت مع Hi-C22 على مستوى الكروموسوم.
يصل التقاط Hi-C كما هو مستخدم في هذه الدراسة إلى دقة أعلى بكثير من 5C المنشور سابقا بناء على إنزيم تقييد قاطع 6-bp47 (الجدول التكميلي 1). الأهم من ذلك ، أن الاستراتيجية المصممة لإثراء وتضخيم التفاعلات المستهدفة في 5C لا تسمح بتحليل خاص بالأليل لتفاعلات الكروماتين. على العكس من ذلك ، يمكن تعيين بيانات Capture Hi-C على وجه التحديد ، مما يسمح بتشريح المناظر الطبيعية الهيكلية ثلاثية الأبعاد لأزواج من الكروموسومات المتماثلة ، على سبيل المثال في الخلايا البشرية أو في خطوط الخلايا الهجينة F1 المشتقة عن طريق عبور سلالات الفئران المختلفةوراثيا 78. لإنشاء خرائط تفاعل Capture Hi-C الخاصة بالأليل بدقة 5 كيلوبايت ، قمنا بتسلسل قراءات طرفية مزدوجة 150 بت لزيادة تغطية SNP. يمكن تطبيق مناهج مماثلة خاصة بالأليل على خطوط الخلايا البشرية ، والتي يتوفر لها شرح SNPs22.
الأهم من ذلك ، على الرغم من أن Capture Hi-C يضمن عموما دقة عالية مع تحسين القدرة على تحمل تكاليف التسلسل ، فإن إنتاج قليل النوكليوتيدات البيوتينيلاتي المصممة خصيصا له تأثير على التكلفة الإجمالية لهذه الطريقة. لذلك ، سيختلف اختيار طريقة 3C الأنسب للتطبيقات المختلفة ، وسيعتمد على السؤال البيولوجي الذي يتم معالجته والقرار المطلوب ، بالإضافة إلى حجم منطقة الاهتمام. تشترك بروتوكولات Capture Hi-C الأخرى التي تم تطويرها في الميزات الرئيسية مع البروتوكول الموضح هنا. على سبيل المثال ، تم تطبيق استراتيجية Capture Hi-C لتوصيف ~ 50 كيلو بايت إلى 1 ميجا بايت من المناطق الجينومية التي تغطي المتغيرات غير المشفرة المرتبطة بخطر الإصابة بسرطان الثدي والقولون والمستقيم. في هذا البروتوكول ، تم سحب المناطق المستهدفة من مكتبات Hi-C عن طريق تهجين طعوم الحمض النووي الريبي 120 مير لتبليط المناطق المستهدفة بتغطية 3x33،38،79. وبالمثل ، تم استخدام HYbrid Capture Hi-C (Hi-C 2) لاستهداف التفاعلات داخل المناطق ذات الاهتمام حتى2 ميجا بايت80. في كلا البروتوكولين ، أدى استخدام قالب Hi-C المخصب لشظايا ربط البيوتين المسحوبة إلى أسفل إلى زيادة النسبة المئوية لإجمالي القراءات الإعلامية مقارنة ببروتوكولنا. على سبيل المثال ، في مجموعة بيانات Hi-C التي استخدمناها هنا للمقارنة64 (GSM2053973) ، فإن النسبة المئوية للأزواج الصالحة بعد إزالة التكرارات أعلى بمقدار 4.8 أضعاف من الأزواج الصالحة التي تم الحصول عليها في Capture Hi-C كما هو موضح في الشكل 3 والجدول التكميلي 1. ومع ذلك ، فإن السحب المتتالي للشظايا المربوطة بالبيوتينيل والمجسات المهجنة يجعل البروتوكول أكثر تعقيدا واستهلاكا للوقت مع تقليل تعقيد المنطقة التي تم التقاطها.
طريقة أخرى متاحة لإثراء قوالب 3C بمجسات التبليط هي Tiled-C ، والتي تم تطبيقها لدراسة بنية الكروماتين بدقة مكانية وزمانية عالية أثناء تمايز الإريثرويدللفأر 43. في Tiled-C ، يتم استخدام لوحة من مجسات البيوتينيل 70 bp لإثراء الاتصالات داخل المناطق واسعة النطاق في جولتين متتاليتين من الالتقاط لإنشاء خرائط عالية الدقة للتفاعلات المستهدفة43,81. كما أن إثراء الالتقاط المزدوج يجعل البروتوكول أطول وأكثر تعقيدا عند مقارنته ب Capture Hi-C. ومع ذلك ، تختلف عن استراتيجيات Capture-C التي تستهدف مواقع تقييد فردية ، في Tiled-C ، لا يبدو أن الجولة الثانية من الالتقاط تزيد بشكل كبير من كفاءة الالتقاط ، وبالتالي يمكن حذفهاعلى الأرجح 43. أخيرا ، تم تطبيق نهج تبليط مماثل يعتمد على نفس استراتيجية التخصيب المستهدفة المستخدمة في هذه الدراسة على تشريح المناظر الطبيعية التنظيمية التي تشمل المتغيرات الهيكلية الموصوفة في المرضى الذين يعانون من تشوهات خلقية وإعادة هندستها في الفئران المعدلة وراثيا41،42. في هذه الحالة ، تم تصميم مجموعة مجسات التجانب عبر الهدف بأكمله بدلا من بالقرب من مواقع تقييد DpnII41. ومع ذلك ، كان هذا العمل أساسيا في تسليط الضوء على حساسية وقوة هذه الاستراتيجية لتحقيق توصيف عالي الدقة للمناطق الجينومية الكبيرة في سياقات مختلفة41،42،48.
في الختام ، يمثل البروتوكول الموصوف هنا استراتيجية سهلة وقوية وقوية لتوصيف 3D عالي الدقة لأي مناطق جينومية ذات أهمية. من المرجح أن يسهل تطبيق هذا النهج على أنظمة النماذج المختلفة ، وأنواع الخلايا ، والمناظر الطبيعية للكروماتين المنظمة تنمويا ، وتنظيم الجينات في الظروف الصحية والمرضية فهمنا للتفاعل والسببية بين طوبولوجيا الجينوم وتنظيم الجينات ، وهو أحد الأسئلة الأساسية المفتوحة في مجال علم التخلق. علاوة على ذلك ، فإن تطبيق Capture Hi-C لرسم خريطة للتفاعلات بعيدة المدى وطي الكروماتين الأعلى مرتبة لمتغيرات المخاطر التي حددتها دراسات GWAS لديه القدرة على الكشف عن الأهمية الوظيفية للمواقع الجينومية غير المشفرة المرتبطة بالأمراض البشرية في سياقات مختلفة ، وبالتالي توفير رؤى جديدة حول العمليات الكامنة الكامنة وراء الإمراض.
كاي هاوشولتز هو عالم التطبيقات الميدانية في Agilent Technologies - مجموعة التشخيص والجينوم. جميع المؤلفين الآخرين يعلنون عدم وجود مصالح متنافسة.
تم دعم العمل في مختبر هيرد بجائزة الباحث المتقدم لمجلس البحوث الأوروبي (XPRESS - AdG671027). يتم دعم A.L. من قبل زمالة ماري سكودوفسكا كوري الفردية للاتحاد الأوروبي (IF-838408). يتم دعم A.H. من قبل شبكة ChromDesign المبتكرة والمتعددة التخصصات ITN ، بموجب اتفاقية Marie Skłodowska-Curie Grant 813327. يعرب المؤلفون عن امتنانهم لدانيال إبراهيم (MPI لعلم الوراثة الجزيئية ، برلين) للحصول على المشورة الفنية المفيدة ، ولمنصة NGS في معهد كوري (باريس) ، ولفلاديمير بينيس ومرفق الجينوم الأساسي في EMBL (هايدلبرغ) ، للدعم والمساعدة.
Name | Company | Catalog Number | Comments |
10x PBS pH 7.4 | Gibco | 10010-023 | |
37% (vol/vol) paraformaldehyde solution | Electron Microscopy Sciences | 15686 | single use glass-vials; do not reuse |
50 mL PP conical tube | Falcon | 352070 | |
Agarose | Sigma | A9539-500g | |
Bioanalyzer | Agilent | G2939BA | |
Cell Scrapers - 25 cm Handle and 3.0 cm Blade | Falcon | 353089 | |
CHIR99021 | Axon Medchem BV | Axon 1386 | |
cOmplete Mini, Protease inhibitor cocktail (EDTA-free) | Merck | 11836170001 | |
Countess Cell Counting Chamber Slides | Invitrogen | C10228 | |
Countess II FL | Invitrogen | ZGEXSCCOUNTESS2FL | Automated cell counter |
Covaris S2 | Covaris | 500217 | Sonicator |
DNA LoBind tube, 1.5 mL | Eppendorf | 30108051 | |
DpnII (50000 units/mL) | New England Biolabs | R0543M | |
Dulbecco's Modified Eagle Medium (DMEM) | Merck | D6429 | |
Ethanol (100%) | Merck | 1.00983.2500 | |
Fetal Bovine Serum (FBS) | Thermo Scientific | 10270106 | |
gelatine from porcine skin | Sigma | G1890 | |
GeneRuler 1 kb Plus DNA Ladder | Thermo Scientific | SM0313 | |
GlycoBlue | Thermo Scientific | AM9516 | Coprecipitant |
High-Sensitivity Bioanlayzer chips | Agilent | 5067-4626 | |
Large Cooling Centrifuge 5920 R | Eppendorf | 5948000018 | |
leukaemia inhibitory factor (LIF) | Merck | ESG1107 | |
Liquiport | KNF | NF300 | Benchtop aspiration system |
Low-binding filter tips | Biozym | VT0260U, VT0240, VT0220, VT0200U | |
Molecular biology grade water | Merck | W3500-6x500ML | |
Next Seq 500 | Illumina | SY-415-1001 | |
Next Seq 500 High Output v2 Kit (300 cycles) | Illumina | FC-404-2004 | |
Nonidet P40 Substitute (NP40) | Merck | 11332473001 | |
PD0325901 | Axon Medchem BV | Axon 1408 | |
Protease inhibitor cocktail (EDTA-free) | Merck | 11873580001 | |
Proteinase K - recombinant, PCR-grade (20 mg/mL) | Thermo Scientific | EO0491 | |
Qubit 2.0 | Thermo Scientific | Q32871 | |
Qubit assay tubes | Thermo Scientific | Q32856 | |
Qubit dsDNA High Sensitivity kit | Thermo Scientific | Q32851 | |
RNase A (10 mg/mL) | Thermo Scientific | EN0531 | |
Sodium acetate pH 5.2 (3M) | Merck | S7899 | |
speed vacuum concentrator | Eppendorf | EP5305000100-1EA | |
Agencourt AMPureXP | Beckman Coulter | A63881 | SPRI beads |
SureSelect Target Enrichment Box 1 | Agilent | 5190-8645 | |
SureSelect Target Enrichment Kit ILM Indexing Hyb Module Box 2 | Agilent | 5190-4455 | |
SureSelect XT Library Prep Kit ILM | Agilent | 5500-0132 | |
T4 ligase (30 units/µL) | Thermo Scientific | EL0013 | |
table-top Centrifuge 5427 R | Eppendorf | 5409000012 | |
Triton-X-100 (500 mL) | Merck | X100-500ML | |
Trypan Blue | Invitrogen | T10282 | |
Trypsine | Thermo Scientific | 25300054 | |
UltraPure Glycine | Thermo Scientific | 15527013 | |
β-mercaptoethanol | Thermo Scientific | 31350010 |
Request permission to reuse the text or figures of this JoVE article
Request PermissionThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. All rights reserved