Method Article
Bu protokol, topolojik olarak ilişkili alanların (TAD'ler) sınırları ve düzenleyici ve diğer DNA dizisi elemanları arasındaki uzun menzilli kromatin etkileşimleri de dahil olmak üzere, mega tabanlı boyutlu hedeflenen genomik bölgelerin 3D organizasyonunu yüksek çözünürlükte karakterize etmek için kullanılan Capture Hi-C yöntemini açıklar.
Genomun mekansal organizasyonu, transkripsiyon, replikasyon, rekombinasyon ve onarım dahil olmak üzere birçok bağlamda işlevine ve düzenlemesine katkıda bulunur. Bu nedenle, genom topolojisi ve fonksiyon arasındaki kesin nedenselliği anlamak çok önemlidir ve giderek daha yoğun araştırmaların konusudur. Kromozom konformasyon yakalama teknolojileri (3C), genomun herhangi bir bölgesi arasındaki etkileşimlerin sıklığını ölçerek kromatinin 3D yapısını çıkarmaya izin verir. Burada, mega tabanlı genomik hedeflerin alele özgü 3D organizasyonunu yüksek çözünürlükte karakterize eden 3C tabanlı bir hedef zenginleştirme yöntemi olan Capture Hi-C'yi gerçekleştirmek için hızlı ve basit bir protokol açıklıyoruz. Capture Hi-C'de hedef bölgeler, aşağı akış yüksek verimli dizilemeden önce bir dizi biyotinile prob tarafından yakalanır. Böylece, teknolojinin zaman etkinliğini ve satın alınabilirliğini geliştirirken daha yüksek çözünürlük ve alele özgüllük elde edilir. Güçlü yönlerini göstermek için, Capture Hi-C protokolü, X-kromozom inaktivasyonunun (XCI) ana düzenleyici lokusu olan fare X-inaktivasyon merkezine (Xic) uygulandı.
Doğrusal genom, bir organizmanın embriyonik gelişimden geçmesi ve yetişkinlik boyunca hayatta kalması için gerekli tüm bilgileri tutar. Bununla birlikte, genetik olarak özdeş hücrelere farklı işlevleri yerine getirmeleri talimatını vermek, farklı dokular ve / veya gelişim aşamaları da dahil olmak üzere belirli bağlamlarda hangi bilgilerin kullanıldığını doğru bir şekilde kontrol etmek için esastır. Genomun üç boyutlu organizasyonunun, doğrusal genomda birkaç yüz kilobaz ile ayrılabilen düzenleyici elemanlar arasındaki fiziksel etkileşimi kolaylaştırarak veya önleyerek gen aktivitesinin bu doğru mekansal-zamansal düzenlemesine katıldığı düşünülmektedir (incelemeler için 1,2,3). Son 20 yılda, genom katlanması ve aktivitesi arasındaki etkileşimi anlamamız, büyük ölçüde kromozom konformasyon yakalama teknolojilerinin (3C) gelişmesi nedeniyle hızla artmıştır (inceleme için 4,5,6,7). Bu yöntemler, genomun herhangi bir bölgesi arasındaki etkileşimlerin sıklığını ölçer ve çekirdek içinde yakın 3B yakınlıkta bulunan DNA dizilerinin bağlanmasına dayanır. En yaygın 3C protokolleri, hücre popülasyonlarının formaldehit gibi çapraz bağlayıcı bir ajanla sabitlenmesiyle başlar. Çapraz bağlı kromatin daha sonra bir kısıtlama enzimi ile sindirilir, ancak MNaz sindirimi de 8,9 kullanılmıştır. Sindirimden sonra, yakın uzamsal yakınlıkta serbest DNA uçları yeniden bağlanır ve çapraz bağlanma tersine çevrilir. Bu adım, çekirdeğe 3B yakınlığında olan dizilerin aynı DNA parçasına bağlanma şansının daha yüksek olduğu karışık bir melez parça havuzu olan 3C 'kütüphanesi' veya 'şablonu'na yol açar. Bu hibrid fragmanların aşağı akış nicelleştirilmesi, doğrusal genomda binlerce baz çifti ayrı ayrı bulunan ancak 3B uzayda etkileşime girebilecek genomik bölgelerin 3B konformasyonunu çıkarmayı sağlar.
3C kütüphanesini karakterize etmek için, hem ligasyon parçalarının hangi alt kümelerinin analiz edildiği hem de aşağı akış nicelleştirmesi için hangi teknolojinin kullanıldığı açısından farklılık gösteren birçok farklı yaklaşım geliştirilmiştir. Orijinal 3C protokolü, iki ilgi alanının seçimine ve PCR10,11 ile 'bire bir' etkileşim frekanslarının ölçülmesine dayanıyordu. 4C yaklaşımı (dairesel kromozom konformasyonu yakalama), tek bir ilgi odağı (yani, 'bakış açısı') ile genomun geri kalanı ('bir tanesine karşı hepsi') arasındaki etkileşimleri ölçer12,13,14. 4C'de, 3C kütüphanesi, bakış açısına özgü primerler15 tarafından güçlendirilmiş PCR olan küçük dairesel DNA molekülleri üretmek için ikinci bir sindirim ve yeniden bağlanma turuna uğrar. 5C (kromozom konformasyonu yakalama karbon kopyası), daha büyük ilgi alanlarındaki 3D etkileşimlerin karakterizasyonunu sağlar ve bu bölgedeki daha yüksek dereceli kromatin katlanmasına ilişkin içgörüler sağlar ("çoğuna karşı çok")16. 5C'de, 3C kütüphanesi, daha sonra evrensel primerler15 ile multipleks PCR ile güçlendirilebilen kısıtlama bölgeleriyle örtüşen oligonükleotidlerden oluşan bir havuza hibritleştirilir. Hem 4C hem de 5C'de, bilgilendirici DNA fragmanları başlangıçta mikrodiziler ve daha sonra yeni nesil dizileme (NGS) 17,18,19 ile ölçülmüştür. Bu stratejiler hedeflenen ilgi alanlarını karakterize eder, ancak genom çapındaki etkileşimleri haritalamak için uygulanamaz. Bu ikinci hedefe, 3C şablonunun büyük ölçüde paralel diziliminin, genom çapında ("hepsine karşı") kromatin katlanmasının tarafsız karakterizasyonuna izin verdiği 3C tabanlı yüksek verimli bir strateji olan Hi-C ile ulaşılır20. Hi-C protokolü, sindirilmiş parçaların uçlarına biyotinile edilmiş bir kalıntının dahil edilmesini içerir, bunu takiben, bağlı parçaların geri kazanımını arttırmak için streptavidin boncukları ile ligasyon parçalarının aşağı çekilmesi takip edilir20.
Hi-C, memeli genomlarının 3D çekirdekte yapısal olarak çoklu ölçeklerde organize olduğunu ortaya koydu. Megabaz ölçeğinde, genom aktif ve inaktif kromatin bölgelerine, sırasıyla A ve B bölmelerine,sırasıyla 20,21'e ayrılır. Farklı kromatin ve aktivite durumları ile temsil edilen diğer alt bölmelerin varlığı da daha sonra gösterilmiştir22. Daha yüksek çözünürlükte, genom ayrıca topolojik olarak ilişkilendiren alanlar (TAD'lar) adı verilen alt megabaz kendi kendine etkileşime giren alanlara bölünür ve ilk olarak insan ve fare genomlarının Hi-C ve 5C analizi ile ortaya çıkar23,24. Dokuya özgü bir şekilde değişen bölmelerin aksine, TAD'lar sabit olma eğilimindedir (birçok istisna olmasına rağmen). Daha da önemlisi, TAD sınırlarıtür 25 arasında korunmaktadır. Memeli hücrelerinde, TAD'lar sıklıkla aynı düzenleyici manzarayı paylaşan genleri kapsar ve komşu düzenleyici alanlarla etkileşimleri sınırlarken gen birlikte düzenlemesini kolaylaştıran yapısal bir çerçeveyi temsil ettiği gösterilmiştir (gözden geçirme için 3,26,27,28). Ayrıca, TAD'lar içinde, kohesin-ekstrüde döngülerin tabanındaki CTCF bölgelerine bağlı etkileşimler, promotör-arttırıcı veya arttırıcı-arttırıcı etkileşimlerinin olasılığını artırabilir (gözden geçirme29 için).
Hi-C'de, bölmeler ve TAD'lar 1 Mb ila 40 kb çözünürlükte algılanabilir, ancak 5-10 kb ölçeğinde distal elemanlar arasındaki döngü etkileşimleri gibi daha küçük ölçekli temasları karakterize etmek için daha yüksek çözünürlük elde edilebilir. Bununla birlikte, bu tür döngüleri HiC ile verimli bir şekilde tespit edebilmek için çözünürlüğün arttırılması, sıralama derinliğinde ve dolayısıyla sıralama maliyetlerinde önemli bir artış gerektirir. Analizin alele özgü olması gerekiyorsa bu durum daha da kötüleşir. Gerçekten de, çözünürlükteki bir X-kat artışı, dizileme derinliğinde bir X2 artışı gerektirir, bu da yüksek çözünürlüklü ve alele özgü genom çapında yaklaşımların engelleyici derecede pahalı olabileceği anlamına gelir30.
Yüksek çözünürlüğü korurken maliyet etkinliğini ve satın alınabilirliği artırmak için, ilgilenilen hedef bölgeler, aşağı akış diziliminden önce tamamlayıcı biyotin etiketli oligonükleotid probları ile hibridizasyonlarını takiben genom çapında 3C veya Hi-C kütüphanelerinden fiziksel olarak aşağı çekilebilir. Bu hedef zenginleştirme stratejileri Capture-C yöntemleri olarak adlandırılır ve genom boyunca dağılmış yüzlerce hedef lokusun etkileşimlerinin sorgulanmasına izin verir (yani, Promoter Capture (PC) Hi-C; Yeni Nesil (NG) Yakalama-C; Düşük Giriş (LI) Yakalama-C; Nükleer Titrated (NuTi) Yakalama-C; Tri-C)31,32,33,34,35,36,37,38,39,40 veya birkaç megabaza kadar uzanan bölgeler arasında (yani, HiC'yi Yakalamak; HYbrid Yakalama Hi-C (Hi-C2); Kiremitli-C)41,42,43. Yakalama tabanlı yöntemlerde iki yön değişebilir: (1) biyotinile oligonükleotidlerin doğası ve tasarımı (yani, RNA veya DNA, dağınık genomik hedefleri yakalayan tek oligolar veya ilgi çekici bir bölgeyi döşeyen çoklu oligolar); ve (2) 3C veya Hi-C kütüphanesi olabilen hedefleri aşağı çekmek için kullanılan şablon, ikincisi 3C kütüphanesinden aşağı çekilen biyotinile kısıtlama parçalarından oluşur.
Burada, 3C kütüphanesinden hedef kişilerin zenginleştirilmesine dayanan bir Capture Hi-C protokolü açıklanmaktadır. Protokol, biyotinile RNA problarının özel olarak uyarlanmış bir döşeme dizisinin tasarımına dayanır ve 3C kütüphanesi hazırlığından NGS dizilemesine kadar 1 hafta içinde gerçekleştirilebilir. Protokol hızlı, basittir ve diğer 3C yöntemlerine kıyasla zaman etkinliğini ve satın alınabilirliği artırırken, 5 kb çözünürlükte megabaz boyutundaki ilgi alanlarının daha yüksek dereceli 3D organizasyonunu karakterize etmeyi sağlar. Capture Hi-C protokolü, Xist kodlamayan RNA'yı barındıran X-kromozom inaktivasyonunun (XCI) ana düzenleyici lokusuna, X-inaktivasyon merkezine (Xic) uygulandı. Xic daha önce kapsamlı yapısal ve fonksiyonel analizlere konu olmuştur (inceleme için44,45). Memelilerde, XCI, dişiler (XX) ve erkekler (XY) arasındaki X'e bağlı genlerin dozajını telafi eder ve dişi hücrelerdeki iki X kromozomundan birinin neredeyse tamamının transkripsiyonel susturulmasını içerir. Xic, 3D genom topolojisindeki çalışmalar ve gen regülasyonu44 ile etkileşim için güçlü, altın standart bir lokusu temsil etmiştir. Fare embriyonik kök hücrelerinde (mESC'ler) Xic'in 5C analizi, TAD'ların keşfedilmesine ve adlandırılmasına yol açarak, topolojik bölümleme ve gen ortak düzenlemesinin işlevsel alaka düzeyine dair ilk bilgileri sağladı24. Xic'in topolojik organizasyonunun daha sonra Xist upregülasyonunun ve XCI 46'nın uygun gelişimsel zamanlamasına kritik olarak dahil olduğu gösterildi ve TAD'lar içindeki ve arasındaki gen aktivitesini etkileyebilecek beklenmedik cis-düzenleyici unsurlar da yakın zamanda Xic47,48,49 içinde keşfedildi. Xic'i kapsayan fare X kromozomunun 3 Mb'ına Capture Hi-C uygulamak, bu yaklaşımın büyük ölçekli kromatin katlanmasını yüksek çözünürlükte parçalamadaki gücünü gösterir. İlgilenilen bölgedeki her DpnII kısıtlama bölgesinde biyotinile prob dizisinin tasarımından başlayarak, genom çapında 3C kütüphanesinin oluşturulmasına, hedef temasların hibridizasyonuna ve yakalanmasına ve aşağı akış veri analizine kadar ayrıntılı ve takip edilmesi kolay bir protokol sağlanmaktadır. Uygun kalite kontrollerine ve beklenen sonuçlara genel bir bakış da dahil edilmekte ve yaklaşımın hem güçlü hem de sınırlı yönleri benzer mevcut yöntemler ışığında tartışılmaktadır.
Bu çalışmada kullanılan fare embriyonik kök hücreleri (mESC'ler), Institut Curie (Paris)51'in hayvan bakım kılavuzlarına göre bir TX/TX R26rtTA/rtTA dişi50 ile Mus musculus castaneus erkeğinin bir haçından türetilmiştir.
1. Prob tasarımı
2. Deneysel prosedür
3. Veri analizi
Açıklanan Capture Hi-C protokolü, dört tabanlı bir kesici (DpnII) kullanılarak genom çapında 3C şablonunun hazırlanmasına dayanmaktadır. İlgilenilen genomik bölge boyunca ligasyon fragmanlarının daha sonraki zenginleştirilmesi, bir dizi döşeme RNA probunun hibridizasyonu ve bu çalışmada kullanılan hedef zenginleştirme sistemine göre streptavidin bazlı yakalanması ile elde edilir (Şekil 1). Biyotinile RNA probları, DNA problarına kıyasla hedeflerine daha sıkı bağlanma afinitesi gösterdikleri için seçildi52,60. Yakalanan kitaplıklar daha sonra dizine alınır ve çoğullanmış yüksek verimli sıralama için havuza alınır. Hi-C verilerini yakalamak, yüksek çözünürlüklü Hi-C etkileşim haritaları olarak görselleştirilebilir, ancak aynı zamanda yakalanan bölgenin tamamındaki destekleyiciler veya arttırıcılar gibi daha küçük dizilerin etkileşimlerini özel olarak görselleştirmek için 4C benzeri tek görüş noktası temas haritaları olarak da görselleştirilebilir. Protokolün iş akışı Şekil 4'te gösterilmiştir. Ön sıralama kalite kontrolleri Şekil 2'de gösterilmiştir ve 3C şablonunun uygun sindiriminin ve yeniden ligasyonunun değerlendirilmesini ve protokolün farklı adımlarında etkili kesilmesini ve saflaştırılmasını içerir. Kesilen 3C şablon DNA'nın 150 ila 700 bp arasında çalışması bekleniyor ve parçaların >2 kb zenginleştirilmesi tespit edilmemelidir. Aşağıdaki adımlarda, önce kesmeden sonra, daha sonra yakalama öncesi ve yakalama sonrası PCR'lerden sonra birkaç boncuk bazlı DNA temizleme ve boyut seçimi adımı gerçekleştirilir. Temizlenen kütüphaneler, yüksek hassasiyetli bir DNA biyoanalizöründe görselleştirildiği gibi farklı bir parça zenginleştirme profili gösterir (Şekil 2). Ortalama parça boyutu, bağdaştırıcıların bağlanması, dizileme ve indeksleme primerleri nedeniyle kütüphane hazırlığı boyunca artar. Sıralama sonrası kalite kontrolleri Hi-C Pro ile elde edilir ve Şekil 3'te gösterilmiştir. 3C benzeri veri işleme ve analizi için birçok farklı biyoinformatik yazılım uygulaması önerilmiştir. Bunlar arasında, HiC-Pro boru hattı, ham sıralama verilerinin çeşitli çözünürlüklerde son temas haritalarına işlenmesine izin veren en popüler çözümlerden biridir55. HiC-Pro, referans genom üzerindeki dizileme okumalarını hizalamak için iki adımlı bir haritalama stratejisi kullanır. 3C ürünleri daha sonra bilgilendirici olmayan temas çiftlerini kaldırmak ve temas haritalarını oluşturmak için yeniden yapılandırılır ve filtrelenir. Ek olarak, alele özgü analiz yapmak ve iki ebeveyn alelinden gelen temasları farklı temas haritalarında ayırmak için bilinen polimorfizmlerin bir listesini kullanabilir. Daha yakın zamanlarda, HiC-Pro, nf-core çerçevesine (nf-core-hic) dahil edildi ve genişletildi, bu da yüksek oranda ölçeklenebilir ve tekrarlanabilir topluluk odaklı bir boru hattı61,62 sağladı.
Xic faresini yakalamak için, X kromozomunun 3 Mb'sini döşeyen 28.913 RNA probu dizisi tasarlandı. Bu bölge, XCI'daki kilit oyuncuyu, uzun kodlamayan gen Xist'i ve bilinen ~ 800 kb düzenleyici manzarasını içerir (Şekil 5). Bu ~ 800 kb bölgesi iki TAD'a bölünmüştür: biri Xist promotörü ve bilinen pozitif düzenleyicileri (yani, kodlamayan transkriptler Ftx, Jpx ve Xert ve protein kodlayan gen Rnf12) ve Xist'in negatif cis-düzenleyicilerini kapsayan komşu TAD (yani, antisens transkript Tsix, geliştirici element Xite ve kodlamayan transkript Linx) (inceleme için44, 45).
Tanımlanan Capture Hi-C protokolünü Xic'e uygulayarak, bu lokusun topolojik organizasyonu benzeri görülmemiş bir çözünürlükte elde edildi (Şekil 6 ve Şekil 7). Bu, özellikle Capture Hi-C profili ile daha önce yayınlanmış 5C47 (Şekil 6 ve Şekil 7; Ek Tablo 1) ve Hi-C61 (Şekil 6 ve Şekil 7; Ek Tablo 1) Profil. Örneğin, alt-TAD yapıları daha belirgindir – Xist promotörünü (Xist-TAD) içeren TAD açıkça iki küçük alana bölünmüştür (Şekil 6A, mavi ok ucu). Önceden, bu, yalıtım puanı algoritması kullanılarak bu bölgede bir sınırın tespit edilmesine rağmen, yalnızca 5C profilinden (Şekil 6B) görsel olarak "tahmin edilebilir". Benzer şekilde, Capture Hi-C profilinin çözünürlüğü, Tsix lokusunun (Tsix-TAD) destekleyicisini içeren komşu TAD'de (Şekil 6A, B) iki küçük etki alanının tanımlanmasına izin verir; bu daha önce 5C ile elde edilememişti (Şekil 6B). Not olarak, Capture Hi-C ve 5C verilerinden yalıtım skoru ile belirlenen topolojik sınırlar genellikle biraz farklı konumlarda ve farklı göreceli güçlerde tespit edilir.
Ayrıca, temas döngüleri gibi diğer alt-TAD yapıları, daha önce Capture-C63 ile tanımlanan Xist ve Ftx arasındaki döngü (Şekil 7A) ve yakın zamanda Capture Hi-C48 için benzer bir protokol kullanılarak tanımlanan Xist ve Xert arasındaki döngü (Şekil 7B) gibi Capture Hi-C verilerinden açıkça görülebilir. Linx, Chic1 ve Xite lokusları arasındaki Tsix-TAD içinde bilinen temas noktalarını oluşturanlar gibi Capture Hi-C profillerinin artan çözünürlüğü nedeniyle diğer kontaklar da daha hassas bir şekilde eşlenebilir (Şekil 7A).
Şekil 7'de gösterilen Hi-C verileriyle karşılaştırıldığında, Capture Hi-C çözünürlükte dört kat artışa izin verdi, ancak sıralama derinliğinin yalnızca dörtte birini gerektiriyordu (yani, 126 M okumalara karşı 571 M) (Ek Tablo 1). Çözünürlükteki bu artış, Şekil 6 ve Şekil 7'de gösterilen sıralama derinliğinde Hi-C tarafından tespit edilemeyen alt TAD'lerin ve döngü etkileşimlerinin algılanmasını sağlar. Capture Hi-C için açıklanan protokol, önceki yaklaşımlara kıyasla, geniş bir genomik bölgenin çok daha ayrıntılı, yüksek çözünürlüklü bir karakterizasyonuna izin verir.
Resim 1: Prob tasarımı. Prob tasarımı için kullanılan stratejinin şematik gösterimi. 3 Mb hedef bölge boyunca her bir DpnII kısıtlama bölgesinin 300 bp yukarı ve aşağı akış bölgeleri seçildi ve üst üste binen biyotinile RNA probları ile döşendi. Bu seçilen bölgelerden biri gösterilir, chrX: 102,474,805-102,475,500. Her probda 40'tan fazla baz tekrarlayan diziye izin verilmez. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.
Şekil 2: Hi-C ön sıralama kalite kontrollerini yakalayın . (A) 3C şablon kalite kontrollerinin temsili örneği. 200 ng DNA,% 1'lik bir agaroz jeline yüklendi. Şerit 1: 1 kb merdiven. Şerit 2: Sindirilmemiş, çapraz bağlı ve bozulmamış kromatin, >10 kb'de keskin bir bant olarak çalışır. Şerit 3: DpnII ile sindirilmiş çapraz bağlı kromatin, 1 kb ila 3 kb arasında bir yayma olarak çalışır. Şerit 4: Son 3C kütüphanesi veya şablonu; Sindirilmiş çapraz bağlı DNA fragmanlarının serbest uçları yeniden bağlanır. Düşük moleküler boyuttaki DNA yayması neredeyse tespit edilemez ve ligasyon ürünü >10 kb'lik bir bant olarak tespit edilir. (B) Yüksek hassasiyetli biyoanalizör DNA profillerinin temsili örnekleri. Sol üst: 150 bp ile 700 bp arasında parça boyutunun dağılımını gösteren başarıyla kesilmiş 3C kütüphanesi. Sağ üst: yetersiz kesilmiş 3C kütüphanesi. Kesilmemiş DNA, parçaların geniş zenginleşmesi olarak tespit edilir >2 kb. (C) Sol altta: SPRI boncukları kullanılarak 1:1 sol taraf boyutunda bir seçimi takiben kesilmiş DNA örneği. ~300 bp'lik parçalar zenginleştirilmiştir. Alt orta: Üreticinin protokolüne göre çift uçlu adaptörlerin bağlanmasından sonra PCR profilini önceden yakalayın. Sağ altta: çoğullanmış sıralama için adaptörler, sıralama ve dizin oluşturma primerleri dahil olmak üzere son Capture Hi-C kitaplığı. Kısaltmalar: bp = baz çiftleri, FU = keyfi floresan birimi. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.
Şekil 3: HiC-Pro ile Hi-C dizileme sonrası kalite kontrollerini yakalayın . (A) Dizileme çiftlerinin ilk eşi için referans genom üzerindeki haritalama hızı örneği. Açık mavi fraksiyon, HiC-Pro tarafından hizalanan ve bir ligasyon kavşağını kapsayan okumaları temsil eder. Bu metrik böylece deneysel ligasyon adımını doğrulamak için kullanılabilir. (B) Dizileme eşleri genom üzerinde hizalandıktan sonra, analiz için yalnızca benzersiz şekilde hizalanmış okuma çiftleri tutulur. (C) Sarkan uç, kendi kendine daire veya yeniden ligasyon gibi geçerli olmayan çiftler (kırmızı renkte) analizden atılır. Geçerli çiftlerin oranı, ligasyonun ve aşağı çekme verimliliğinin iyi bir göstergesidir. (D) Geçerli çiftler ayrıca intra/interkromozomal ve kısa/uzun menzilli temaslara ayrılabilir. PCR yapıtlarını temsil etmesi muhtemel yinelenen okuma çiftleri analizden atılır. (E) Alele özgü analiz için HiC-Pro, her ebeveyn genomu için bir veya iki eş tarafından desteklenen allelik okuma sayısını bildirir (yani, C57BL / 6J x CASTEi / J). Anne ve baba aleline atanan okumaların aynı kısmı beklenir. (F) Son olarak, temas haritalarını oluşturmak için yalnızca yakalama bölgesiyle çakışan geçerli çiftler seçilir. Yakalama-yakalama çiftleri hedeflenen bölge içindeki kişileri temsil ederken, yakalama-raporlayıcı çiftleri hedeflenen bölge ile hedef dışı bölge arasındaki etkileşimi içerir. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.
Şekil 4: Capture Hi-C protokolünün iş akışı. Farklı protokol adımlarının şematik gösterimi. Genom çapında 3C şablonunu oluşturmak için, kromatin önce formaldehit ile çapraz bağlanır ve daha sonra DpnII kısıtlama enzimi ile sindirilir. Serbest DNA uçları daha sonra yeniden bağlanır, çapraz bağlanma tersine çevrilir ve DNA saflaştırılır. Hedef bölgeyi kapsayan parçaları zenginleştirmek için, bir dizi biyotinillenmiş RNA probu 3C şablonuna hibridize edilir ve streptavidin aracılı aşağı çekme ile yakalanır. Yakalama kitaplıkları çoğullanmış sıralama için işlenir ve yüksek çözünürlüklü etkileşim haritaları olarak görselleştirilen hedef boyunca kromatin temaslarının sıklığını çıkarmak için geçerli ligasyon parçaları ölçülür. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.
Şekil 5: Fare X kromozomu üzerindeki Xic'i kapsayan bölgeye genel bakış. Fare X kromozomunun şematik gösterimi ve yakalanan 3 Mb bölgesinin yakınlaştırılması (ChrX: 102.475.000-105.475.000). Hedeflenen bölge, XCI'nın ana düzenleyici lokusu olan Xic'e karşılık gelen ~ 800 kb DNA içerir. Xic , uzun kodlamayan genleri, XCI'nın önemli bir oyuncusu olan Xist'i ve düzenleyici manzarasını içerir. Xist'in pozitif düzenleyicileri yeşil, negatif regülatörleri mor renkte gösterilmiştir. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.
Şekil 6: Yakalanan 3 Mb bölge boyunca Hi-C, 5C ve Hi-C etkileşim haritalarını yakalayın. (A) Fare Xic'ini kapsayan 3 Mb hedefin Hi-C etkileşim haritasını 10 kb çözünürlükte yakalayın (bu çalışma). (B) 6 kb çözünürlükte A'dakiyle aynı hedef bölgenin 5C etkileşim haritası (47'den yeniden işlenen veriler). Analizlerde yer almayan tekrarlayan bölgeler beyaz renkte maskelenir. 5C verileri kendi biyoinformatik işlemlerini gerektirir (bkz.47). Temizleme ve hizalamadan sonra, astar çözünürlüğündeki 5C haritaları, 6 kb'lik bir nihai çözünürlüğe ulaşmak için çalışan bir medyan (pencere = 30 kb, adım = 5) kullanılarak bağlanır. (C) 40 kb çözünürlükte A ve B'deki ile aynı genomik bölgenin Hi-C etkileşim haritası (64'ten yeniden işlenen veriler). Tüm etkileşim haritaları fare ESC'lerinden oluşturulmuştur. İzolasyon skoru cooltools kullanılarak hesaplanmıştır ve TAD sınırlarında yalıtım minimleri ile histogramlar olarak temsil edilir. TAD sınırları haritanın altında dikey çizgiler olarak gösterilir. Her çizginin yüksekliği sınır kuvvetini gösterir. Genler, transkripsiyon yönünü gösteren oklar olarak gösterilir. Yalnızca veya daha kesin olarak Capture Hi-C haritalarında algılanan alt TAD sınırları, sırasıyla Tsix ve Xist TAD'lardaki alt-TAD'lar için macenta ve mavi ok uçlarıyla gösterilir. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.
Şekil 7: Yakalanan bölge içinde 1 Mb boyunca Hi-C, 5C ve Hi-C etkileşim haritalarını yakalayın. (A) Fare Xic'ini kapsayan 1 Mb genomik bölgenin Hi-C etkileşim haritasını 5 kb çözünürlükte yakalayın (bu çalışma). (B) A'dakiyle aynı genomik bölgenin 5C etkileşim haritası. 6 KB çözünürlükte (47'den yeniden işlenen veriler). Analizlerde yer almayan tekrarlayan bölgeler beyaz renkte maskelenir. Not olarak, 5C verileri kendi biyoinformatik işlemlerini gerektirir (bkz.47). Temizleme ve hizalamadan sonra, astar çözünürlüğündeki 5C haritaları, 6 kb'lik bir nihai çözünürlüğe ulaşmak için çalışan bir medyan (pencere = 30 kb, adım = 5) kullanılarak bağlanır. (C) Hi-C'nin A ve B'sindeki ile aynı genomik bölgenin Hi-C etkileşim haritası 20 kb çözünürlükte (veriler 64'ten yeniden işlenir). Tüm etkileşim haritaları mESC'lerden oluşturulmuştur. İzolasyon skoru cooltools kullanılarak hesaplanmıştır ve TAD sınırlarında yalıtım minimleri ile histogramlar olarak temsil edilir. TAD sınırları haritanın altında dikey çizgiler olarak gösterilir. Her çizginin yüksekliği sınır kuvvetini gösterir. Genler, transkripsiyon yönüne işaret eden oklar olarak gösterilir. Capture Hi-C'de özel olarak veya daha hassas bir şekilde algılanan temas döngüleri, sırasıyla Tsix ve Xist TAD'lardaki döngüler için macenta ve mavi yıldız işaretleriyle gösterilir. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.
Ek Tablo 1: Bu makalede kullanılan veri kümeleri için sıralama sonrası istatistikler: Capture Hi-C (bu çalışma), Hi-C64 ve 5C47. Bu Dosyayı indirmek için lütfen buraya tıklayın.
Burada, megabaz boyutlu genomik bölgelerin 5-10 kb çözünürlükte daha üst düzey organizasyonunu karakterize etmek için nispeten hızlı ve kolay bir Capture Hi-C protokolünü açıklıyoruz. Capture Hi-C, genom çapında 3C veya Hi-C şablonlarından hedeflenen kromatin etkileşimlerini zenginleştirmek için tasarlanmış Capture-C teknolojileri ailesine aittir. Bugüne kadar, Capture-C uygulamalarının büyük çoğunluğu, tüm genoma dağılmış nispeten küçük düzenleyici elementlerin kromatin temaslarını haritalamak için kullanılmıştır. İlk Capture-C protokolünde, eritroid hücrelerden hazırlanan 3C kütüphanelerinde önceden seçilmiş >400 promotör yakalamak için çoklu örtüşen RNA biyotinile probları kullanıldı31. Aynı strateji daha sonra Yeni Nesil (NG) ve Nükleer Titrated (NuTi) Yakalama-C'de, bilgilendirici ligasyon parçalarının zenginleştirilmesini en üst düzeye çıkarmak için tek kısıtlama bölgelerini kapsayan tek 120 bp DNA yemleri ve iki sıralı Yakalama turu kullanarak 8.000 > destekçinin yüksek çözünürlüklü etkileşim profillerini elde etmek için geliştirildi32,40. Bu stratejiler, fare embriyonik gelişimi, hücre farklılaşması, X-kromozomu inaktivasyonu ve patolojik durumlarda gen yanlış regülasyonu dahil olmak üzere birçok farklı bağlamda cis etkili elementlerin fonksiyonel diseksiyonuna yol açmıştır 46,63,65,66,67,68,69,70,71.
Promoter Capture Hi-C'de (PCHi-C), kısıtlama fragmanları içeren >22.000 açıklamalı promotör, kısıtlama fragmanı 34,72'nin herhangi birinde veya her iki ucunda tek RNA 120-mer biyotinile probların hibridizasyonu ile Hi-C kütüphanelerinden aşağı çekildi. Bu yöntem, fare embriyonik kök hücreleri, fetal karaciğer hücreleri ve adipositler 34,35,72,73, aynı zamanda insan lenfoblastoid çizgileri, hematopoetik progenitörler, epidermal keratinositler ve pluripotent hücreler 37,74,75,76,77 dahil olmak üzere hızla artan sayıda hücre tipinde binlerce promotörün interaktomunun diseksiyonuna izin verdi.
Bu hedef zenginleştirme teknolojileriyle karşılaştırıldığında, Capture Hi-C, megabaz ölçeğine kadar bitişik genomik bölgeleri hedefler, böylece bir veya daha fazla TAD'yi kapsar ve genlerin düzenleyici manzaralarını kapsar. İlgilenilen bölgenin tamamı, hedef içindeki her bir DpnII kısıtlama bölgesini kapsayan bir dizi biyotinile prob ile döşenmelidir. Biyotinillenmiş dizinin 3C şablonuna hibridizasyonu, ardından streptavidin tabanlı yakalama ve çoğullanmış dizileme için işleme, Illumina Paired-End çoklanmış dizileme için bir hedef zenginleştirme sistemi kullanılarak gerçekleştirilir. Tüm protokol hızlıdır, çünkü 3C kütüphane hazırlığından NGS sıralamasına kadar 1 hafta içinde gerçekleştirilebilir ve yalnızca küçük uyarlamalar ve / veya özel özel sorun giderme gerektirir.
Protokol ayrıca diğer 3C tabanlı yöntemlere kıyasla avantajlar sağlar. 5-10 kb çözünürlükte etkileşim haritaları elde etmek için 100-120 M çift uçlu okumaları sıraladık. Bir karşılaştırma olarak, burada 20 kb çözünürlük64'e (GSM2053973) ulaşmak için 571 M okumalık bir Hi-C veri kümesi kullandık ve kromozom çapındaHi-C 22 ile 5 kb çözünürlüğe ulaşmak için en az 1 milyar okuma gerekecekti.
Bu çalışmada kullanılan Hi-C'yi yakalamak, 6-bp kesici kısıtlama enzimi47'ye dayanan daha önce yayınlanmış 5C'den çok daha yüksek bir çözünürlüğe ulaşmaktadır (Ek Tablo 1). Önemli olarak, 5C'de hedeflenen etkileşimleri zenginleştirmek ve güçlendirmek için tasarlanan strateji, kromatin etkileşimlerinin alele özgü analizine izin vermemektedir. Aksine, Capture Hi-C verileri spesifik olarak alel ile eşlenebilir, bu da homolog kromozom çiftlerinin 3D yapısal manzaralarının, örneğin insan hücrelerinde veya genetik olarak farklı fare suşlarının78'i geçerek türetilen F1 hibrid hücre çizgilerinde diseksiyonuna izin verir. 5 kb çözünürlükte alele özgü Capture Hi-C etkileşim haritaları oluşturmak için, SNP kapsamını artırmak amacıyla 150 bp çift uçlu okumaları sıraladık. Benzer alele özgü yaklaşımlar, SNP'lerin ek açıklamasının mevcut olduğu insan hücre hatlarına uygulanabilir22.
Daha da önemlisi, Capture Hi-C, sıralama maliyetlerinin karşılanabilirliğini artırırken genellikle yüksek çözünürlük sağlasa da, özel olarak uyarlanmış biyotinile oligonükleotidlerin üretimi, bu yöntemin genel maliyeti üzerinde bir etkiye sahiptir. Bu nedenle, en uygun 3C yönteminin seçimi farklı uygulamalar için farklılık gösterecek ve ele alınan biyolojik soruya ve gerekli çözüme ve ayrıca ilgili bölgenin büyüklüğüne bağlı olacaktır. Geliştirilen diğer Capture Hi-C protokolleri, temel özellikleri burada açıklanan protokolle paylaşır. Örneğin, meme ve kolorektal kanser riski ile ilişkili kodlamayan varyantları kapsayan ~ 50 kb ila 1 Mb genomik bölgeleri karakterize etmek için bir Capture Hi-C stratejisi uygulanmıştır; Bu protokolde, hedef bölgeler Hi-C kütüphanelerinden aşağı çekilerek, hedef bölgeleri 3x kapsama alanı33,38,79'da döşeyen 120-mer RNA yemleri hibridize edildi. Benzer şekilde, HYbrid Capture Hi-C (Hi-C 2),2 Mb80'e kadar ilgi duyulan bölgelerdeki etkileşimleri hedeflemek için kullanıldı. Her iki protokolde de, biyotin aşağı çekilmiş ligasyon fragmanları için zenginleştirilmiş bir Hi-C şablonunun kullanılması, protokolümüze kıyasla toplam bilgilendirici okumaların yüzdesini arttırmıştır. Örneğin, karşılaştırma64 (GSM2053973) için burada kullandığımız Hi-C veri kümesinde, kopyaların kaldırılmasından sonraki geçerli çiftlerin yüzdesi, Şekil 3 ve Ek Tablo 1'de açıklandığı gibi Capture Hi-C'de elde edilen geçerli çiftlerden 4,8 kat daha yüksektir. Bununla birlikte, biyotinile bağlanmış parçaların ve hibridize probların art arda aşağı çekilmesi, protokolü önemli ölçüde daha karmaşık ve zaman alıcı hale getirirken, muhtemelen yakalanan bölgenin karmaşıklığını azaltır.
3C şablonlarını döşeme problarıyla zenginleştirmek için mevcut bir başka yöntem, fare eritroid farklılaşması43 sırasında kromatin mimarisini yüksek uzamsal ve zamansal çözünürlükte incelemek için uygulanan Tiled-C'dir. Tiled-C'de, hedeflenen etkileşimlerin çok yüksek çözünürlüklü haritalarını oluşturmak için iki ardışık yakalama turunda büyük ölçekli bölgelerdeki temasları zenginleştirmek için70 bp biyotinile problardan oluşan bir panel kullanılır 43,81. Çift yakalama zenginleştirme ayrıca protokolü Capture Hi-C'ye kıyasla daha uzun ve daha karmaşık hale getirir. Bununla birlikte, tek kısıtlama alanlarını hedefleyen Capture-C stratejilerinden farklı olarak, Tiled-C'de ikinci yakalama turu yakalama verimliliğini önemli ölçüde artırmıyor gibi görünmektedir ve bu nedenle muhtemelen43 atlanabilir. Son olarak, bu çalışmada kullanılan aynı hedef zenginleştirme stratejisine dayanan benzer bir döşeme yaklaşımı, konjenital malformasyonlu hastalarda tanımlanan ve transgenik farelerde yeniden tasarlanan yapısal varyantları kapsayan düzenleyici manzaraların diseksiyonuna uygulanmıştır41,42. Bu durumda, probların döşeme dizisi, DpnII kısıtlama bölgeleri41'in yakınından ziyade tüm hedef boyunca tasarlanmıştır. Bununla birlikte, bu çalışma, farklı bağlamlarda büyük genomik bölgelerin yüksek çözünürlüklü karakterizasyonunu elde etmek için bu stratejinin duyarlılığını ve gücünü vurgulamada ufuk açıcıydı41,42,48.
Sonuç olarak, burada açıklanan protokol, ilgilenilen herhangi bir genomik bölgenin yüksek çözünürlüklü 3D karakterizasyonu için kolay, sağlam ve güçlü bir stratejiyi temsil etmektedir. Bu yaklaşımın farklı model sistemlere, hücre tiplerine, gelişimsel olarak düzenlenmiş kromatin manzaralarına ve sağlıklı ve patolojik koşullarda gen düzenlemesine uygulanmasının, epigenetik alanındaki temel açık sorulardan biri olan genom topolojisi ile gen regülasyonu arasındaki etkileşim ve nedensellik hakkındaki anlayışımızı kolaylaştırması muhtemeldir. Ayrıca, GWAS çalışmaları tarafından tanımlanan risk varyantlarının uzun menzilli etkileşimlerini ve daha yüksek dereceli kromatin katlanmasını haritalamak için Capture Hi-C'nin uygulanması, farklı bağlamlarda insan hastalıklarıyla ilişkili kodlamayan genomik lokusların fonksiyonel alaka düzeyini ortaya çıkarma potansiyeline sahiptir ve böylece potansiyel olarak altta yatan patogenezin süreçlerine yeni bakış açıları sağlar.
Kai Hauschulz, Agilent Technologies - Teşhis ve Genomik Grubu'nda Saha Uygulama Bilimcisidir. Diğer tüm yazarlar birbiriyle çelişen çıkarlar beyan etmemektedir.
Heard laboratuvarındaki çalışmalar Avrupa Araştırma Konseyi İleri Araştırmacı ödülü (XPRESS - AdG671027) ile desteklenmiştir. A.L., Avrupa Birliği Marie Skłodowska-Curie Eylemleri Bireysel Bursu (IF-838408) tarafından desteklenmektedir. A.H., ITN Yenilikçi ve Disiplinlerarası Ağ ChromDesign tarafından Marie Skłodowska-Curie Hibe anlaşması 813327 kapsamında desteklenmektedir. Yazarlar, Daniel Ibrahim'e (MPI for Molecular Genetics, Berlin) yararlı teknik tavsiyeler için, Institut Curie'deki (Paris) NGS platformuna ve Vladimir Benes'e ve EMBL'deki (Heidelberg) Genomik Çekirdek Tesisi'ne destek ve yardım için teşekkür eder.
Name | Company | Catalog Number | Comments |
10x PBS pH 7.4 | Gibco | 10010-023 | |
37% (vol/vol) paraformaldehyde solution | Electron Microscopy Sciences | 15686 | single use glass-vials; do not reuse |
50 mL PP conical tube | Falcon | 352070 | |
Agarose | Sigma | A9539-500g | |
Bioanalyzer | Agilent | G2939BA | |
Cell Scrapers - 25 cm Handle and 3.0 cm Blade | Falcon | 353089 | |
CHIR99021 | Axon Medchem BV | Axon 1386 | |
cOmplete Mini, Protease inhibitor cocktail (EDTA-free) | Merck | 11836170001 | |
Countess Cell Counting Chamber Slides | Invitrogen | C10228 | |
Countess II FL | Invitrogen | ZGEXSCCOUNTESS2FL | Automated cell counter |
Covaris S2 | Covaris | 500217 | Sonicator |
DNA LoBind tube, 1.5 mL | Eppendorf | 30108051 | |
DpnII (50000 units/mL) | New England Biolabs | R0543M | |
Dulbecco's Modified Eagle Medium (DMEM) | Merck | D6429 | |
Ethanol (100%) | Merck | 1.00983.2500 | |
Fetal Bovine Serum (FBS) | Thermo Scientific | 10270106 | |
gelatine from porcine skin | Sigma | G1890 | |
GeneRuler 1 kb Plus DNA Ladder | Thermo Scientific | SM0313 | |
GlycoBlue | Thermo Scientific | AM9516 | Coprecipitant |
High-Sensitivity Bioanlayzer chips | Agilent | 5067-4626 | |
Large Cooling Centrifuge 5920 R | Eppendorf | 5948000018 | |
leukaemia inhibitory factor (LIF) | Merck | ESG1107 | |
Liquiport | KNF | NF300 | Benchtop aspiration system |
Low-binding filter tips | Biozym | VT0260U, VT0240, VT0220, VT0200U | |
Molecular biology grade water | Merck | W3500-6x500ML | |
Next Seq 500 | Illumina | SY-415-1001 | |
Next Seq 500 High Output v2 Kit (300 cycles) | Illumina | FC-404-2004 | |
Nonidet P40 Substitute (NP40) | Merck | 11332473001 | |
PD0325901 | Axon Medchem BV | Axon 1408 | |
Protease inhibitor cocktail (EDTA-free) | Merck | 11873580001 | |
Proteinase K - recombinant, PCR-grade (20 mg/mL) | Thermo Scientific | EO0491 | |
Qubit 2.0 | Thermo Scientific | Q32871 | |
Qubit assay tubes | Thermo Scientific | Q32856 | |
Qubit dsDNA High Sensitivity kit | Thermo Scientific | Q32851 | |
RNase A (10 mg/mL) | Thermo Scientific | EN0531 | |
Sodium acetate pH 5.2 (3M) | Merck | S7899 | |
speed vacuum concentrator | Eppendorf | EP5305000100-1EA | |
Agencourt AMPureXP | Beckman Coulter | A63881 | SPRI beads |
SureSelect Target Enrichment Box 1 | Agilent | 5190-8645 | |
SureSelect Target Enrichment Kit ILM Indexing Hyb Module Box 2 | Agilent | 5190-4455 | |
SureSelect XT Library Prep Kit ILM | Agilent | 5500-0132 | |
T4 ligase (30 units/µL) | Thermo Scientific | EL0013 | |
table-top Centrifuge 5427 R | Eppendorf | 5409000012 | |
Triton-X-100 (500 mL) | Merck | X100-500ML | |
Trypan Blue | Invitrogen | T10282 | |
Trypsine | Thermo Scientific | 25300054 | |
UltraPure Glycine | Thermo Scientific | 15527013 | |
β-mercaptoethanol | Thermo Scientific | 31350010 |
Bu JoVE makalesinin metnini veya resimlerini yeniden kullanma izni talebi
Izin talebiThis article has been published
Video Coming Soon
JoVE Hakkında
Telif Hakkı © 2020 MyJove Corporation. Tüm hakları saklıdır