Method Article
Hi-C 3.0 是一种改进的 Hi-C 方案,它将甲醛和二琥珀酰亚胺戊二酸酯交联剂与 DpnII 和 DdeI 限制性内切酶的混合物相结合,以提高信噪比和染色质相互作用检测的分辨率。
染色体构象捕获(3C)用于检测三维染色质相互作用。通常,与甲醛(FA)的化学交联用于固定染色质相互作用。然后,使用限制性内切酶消化染色质并随后连接片段末端,将三维(3D)接近转化为独特的连接产物。最后,在逆转交联、蛋白质去除和DNA分离后,剪切DNA并准备用于高通量测序。成对位点的邻近连接频率是它们在细胞群中三维空间中共定位频率的量度。
测序的Hi-C文库提供了所有位点对之间相互作用频率的全基因组信息。Hi-C的分辨率和精度依赖于维持染色质接触和染色质频繁均匀碎裂的高效交联。本文描述了一种改进的 原位 Hi-C方案Hi-C 3.0,该方案通过结合两种交联剂(甲醛[FA]和二琥珀酰亚胺戊二酸[DSG])来提高交联效率,然后使用两种限制性内切酶(DpnII和DdeI)进行更精细的消化。Hi-C 3.0 是一种单一协议,用于准确定量较小尺度(如环和拓扑关联域 (TAD))的基因组折叠特征,以及较大细胞核范围尺度(如区室)的特征。
染色体构象捕获自 2002 年以来一直使用1.从根本上说,每个构象捕获变体都依赖于DNA-蛋白质和蛋白质-蛋白质相互作用的固定来保持3D染色质组织。接下来是DNA片段化,通常是限制性酶切,最后是连接附近的DNA末端,将空间近端位点转化为独特的共价DNA序列。最初的3C方案使用PCR对特定的"一对一"相互作用进行采样。随后的4C测定允许检测"一对多"相互作用2,而5C检测"多对多"相互作用3。染色体构象捕获在实施下一代高通量测序(NGS)后完全实现,这允许使用全基因组Hi-C 4和类似技术(如3C-seq5,TCC6和Micro-C 7,8)检测"全对所有人"基因组相互作用(另见Denker和De Laat9的评论)。
在Hi-C中,生物素化的核苷酸用于在消化后和连接之前标记5′突出部分(图1)。这允许使用链霉亲和素包被的磁珠选择正确消化和连接的片段,使其与GCC10区分开来。Rao等人11对Hi-C方案进行了重要更新,他们在完整细胞核(即 原位)中进行消化和连接以减少虚假连接产物。此外,用MboI(或DpnII)消化代替HindIII酶切减少了片段大小并提高了Hi-C的分离潜力。这种增加允许检测相对较小的结构和接触点的更精确的基因组定位,例如小顺式元件之间的DNA环,例如,由环挤出产生的CTCF结合位点之间的环11,12。然而,这种潜力是有代价的。首先,分辨率提高两倍需要测序读数增加四倍(22)13。其次,小片段尺寸增加了将未消化的相邻片段误认为消化和连接的片段的可能性14。如前所述,在Hi-C中,消化和连接的片段与未消化的片段的不同之处在于连接连接处存在生物素。然而,需要从未连接的末端适当去除生物素,以确保仅将连接连接向下拉14,15。
随着NGS成本的降低,更详细地研究染色体折叠变得可行。为了减小DNA片段的大小,从而提高分辨率,Hi-C方案可以适应使用更频繁的切割限制性内切酶16或使用限制性内切酶17,18,19的组合。或者,可以滴定Micro-C中的MNase7,8和DNaseHi-C 20中的DNase以达到最佳消化。
最近对 3C 方法基础的系统评估表明,通过 1% FA 的顺序交联和 3 mM DSG17,在每个长度尺度上对染色体折叠特征的检测都得到了显着改善。此外,具有HindIII消化的Hi-C是检测大规模折叠特征(如隔室)的最佳选择,而Micro-C在检测DNA环等小规模折叠特征方面具有优势。这些结果导致了单一高分辨率"Hi-C 3.0"策略的开发,该策略使用FA和DSG交联剂的组合,然后与DpnII和DdeI核酸内切酶21进行双重酶解。Hi-C 3.0 为一般用途提供了一种有效的策略,因为它可以准确检测所有长度尺度上的折叠特征17。此处详细介绍了Hi-C 3.0协议的实验部分,并显示了测序后可以预期的典型结果。
图 1:Hi-C 程序分为六个步骤。 首先用FA固定细胞,然后用DSG(1)固定细胞。然后,裂解先于DdeI和DpnII的双重酶切(2)。通过突出填充添加生物素,并在DNA纯化之前连接近端钝端(3)(4)。在超声处理和尺寸选择之前,将生物素从未连接的末端去除(5)。最后,生物素的下拉允许通过PCR进行接头连接和文库扩增(6)。缩写:FA = 甲醛;DSG = 戊二酸二琥珀酰亚胺酯;B = 生物素。 请点击此处查看此图的大图。
1. 交联固定
2. 染色体构象捕获
表1:消化试剂。请按此下载此表格。
表 2:生物素填充试剂。 *请注意,更换酶可能需要不同的缓冲液和生物素化的dNTP。 请按此下载此表格。
表3:连接混合试剂。 缩写:BSA = 牛血清白蛋白。 请按此下载此表格。
表4:用于质量和尺寸选择评估的凝胶上样参数。请按此下载此表格。
图2:琼脂糖凝胶显示典型的DNA后纯化质量控制结果 。 (A)CI对照应指示高分子量DNA的条带。(B)DC和Hi-C样品显示一系列DNA大小。Hi-C样品已合并成更大的片段,其分子量应高于DC。标记物的浓度范围允许生成标准曲线。请注意,在本例中,CI上样于单独的凝胶上,但建议将所有样品和对照一起上样并运行。缩写:CI = 染色质完整性;DC = 消解控制;Hi-C = 邻近连接。 请点击此处查看此图的大图。
3. Hi-C测序文库制备
表5:生物素去除试剂和温度 请点击此处下载此表。
表 6:超声处理参数。请按此下载此表格。
表 7:末端修复试剂和温度。请按此下载此表格。
表 8:A尾试剂和温度。请按此下载此表格。
表 9:PCR 引物和配对末端适配器寡核苷酸,试剂退火退火。 缩写:5PHOS = 5' 磷酸盐。星号表示硫代磷酸化的DNA碱基。 #将索引寡核苷酸与通用寡核苷酸合并以退火到索引适配器中。 请按此下载此表格。
表 10:接头连接试剂。请按此下载此表格。
表11:PCR试剂和循环参数。请按此下载此表格。
图 3:琼脂糖凝胶显示了典型的尺寸后选择结果。 显示了四个样品(编号为1-4)的DpnII-DdeI Hi-C的上限和下部。每个样品的第一个泳道包含来自 0.8x 磁珠混合物的上级分,第二和第三泳道包含来自 1.1x 磁珠混合物的下级分的稀释液。 请点击此处查看此图的大图。
图 4:具有 PCR 滴定结果的琼脂糖凝胶。 从 5 个 PCR 循环开始,每 2 个循环(5、7、9 和 11 个循环)对四个文库中的每一个采集样品。根据该图,选择6个循环作为每个样品的最佳循环。 请点击此处查看此图的大图。
图 5:最终 PCR 产物。 清洁和尺寸选择后,将PCR产物(Hi-C)加载到同一文库(ClaI)的ClaI酶切部分旁边。ClaI消化片段表明存在广受欢迎的DpnII-DpnII连接。请注意,ClaI不能消化DpnII-DdeI连接,因此,并非所有连接都有助于减小此限制的尺寸。 请点击此处查看此图的大图。
这份手稿中的数字是由Lafontaine等人之前发表的一个单独的重复实验产生的,21。获得高通量测序数据后,使用 Open Chromatin Collective (Open2C:https://github.com/open2c)处理Hi-C数据。类似的管道可以在4D Nucleome项目(https://data.4dnucleome.org/resources/data-analysis/hi_c-processing-pipeline)的数据门户上找到。简而言之,Nextflow管道蒸馏器(https://github.com/open2c/distiller-nf)的实施是为了(1)将Hi-C分子的序列与参考基因组对齐,(2)使用Hi-C对解析.sam比对和形成文件,(3)过滤PCR重复项,以及(4)将配对聚合成Hi-C相互作用的分箱矩阵。然后,可以(1)在HiGlass服务器(https://higlass.io/)上查看这些HDF5格式的矩阵,以及(2)使用开放染色质集体(https://github.com/open2c/cooltools)维护的"cooltools"集合中存在的大量开源计算工具进行分析,以提取和量化折叠特征,例如隔室,TAD和环。
Hi-C3.0文库的一些质量指标可以在将读对映射到参考基因组后立即进行评估,使用一些简单的指标/指标。首先,通常~50%的测序读对可以唯一地定位于人类细胞。由于染色体的聚合性质,大多数这些映射的读段(~60%-90%)代表染色体内的相互作用(顺式),相互作用频率随着基因组距离的增加而迅速衰减(距离依赖性衰变)。距离依赖性衰变可以在"缩放图"中最好地可视化,该图将接触概率(每个染色体臂)显示为基因组距离的函数。我们发现,使用不同的交联剂和酶可以改变长距离和短距离的距离依赖性衰变17。当与Mnase等酶和产生较小片段的DpnII-DdeI组合结合使用时,DSG交联的添加提高了短距离相互作用的可检测性(图6A)。
距离依赖性衰减也可以直接从 2D 交互矩阵中观察到:当远离中心对角线时,相互作用变得更加不频繁(图 6B)。此外,可以从Hi-C矩阵和缩放图中识别基因组折叠特征,例如区室,TAD和环,作为与一般全基因组平均距离依赖性衰减的偏差。重要的是,除了FA之外,与DSG交联可减少随机连接,由于染色体的聚合物性质,随机连接不受限制,因此更有可能发生在染色体之间(反式)(图6C)。减少随机连接会导致信噪比增加,特别是对于染色体间和超长距离(>10-50 Mb)染色体内相互作用。
图 6:映射和过滤的 Hi-C 库的代表性结果。 (A)具有各种酶的接触概率及其衍生物的缩放图,按片段长度(顶部)排序,并与FA或FA + DSG(底部)交联。使用MNAse(microC)或DpnII-DdeI(Hi-C 3.0)进行消化可显着增加短距离接触(顶部),将DSG添加到FA(底部)也是如此。(B)列显示了仅FA交联后DpnII消化和FA + DSG交联后DpnII或DdeI消化的Hi-C热图。白色箭头显示DSG交联和DdeI消化后"点"的强度增加,这意味着可以更好地检测DNA环。行以递增的分辨率显示 3 号染色体的不同部分,与图 C 对齐:第一行:整个 3 号染色体 (0-198,295,559 Mb);中间排:186-196 Mb;底行:191.0-191.5 Mb。 (C) A 中描述区域的覆盖率图。黑色箭头显示仅 FA 交联的较低覆盖率(%顺式读数)。缩写:FA = 甲醛;DSG = 戊二酸二琥珀酰亚胺酯;CHR = 染色体。请点击此处查看此图的大图。
并非所有映射读取都很有用。第二个质量指标是PCR重复的数量。在连接和超声处理后,不太可能偶然发生精确的重复读数。因此,这种读取可能是由PCR扩增引起的,需要过滤掉。当需要太多PCR循环来扩增低复杂度文库时,通常会出现重复。通常,对于Hi-C,大多数文库只需要5-8个循环的最终PCR扩增,通过滴定PCR确定(见步骤3.9; 图4)。然而,即使在14个PCR扩增循环后,也可以获得具有足够复杂性的文库。
另一类重复读取,即所谓的光学重复,可能来自使用图案化流通池(如HiSeq4000)的Illumina测序平台上的扩增过程。光学重复来自流通池过载,导致(大)簇被称为两个单独的簇,或者在第一轮PCR后原始配对末端分子的局部重新聚集。由于这两种类型的光学重复都是局部的,因此可以通过它们在流通池上的位置来识别它们并将其与PCR重复进行区分。PCR重复>15%的文库需要再生,而具有光学重复的文库可以在优化加载过程后重新加载。
补充表S1:缓冲液和溶液。请按此下载此表格。
细胞处理的关键步骤
虽然可以使用较少数量的输入细胞,但该协议已针对每个测序通道(~400 M读数)~5×106 个细胞进行了优化,以确保深度测序后适当的复杂性。细胞最好在固定前计数。对于超深库的生成,我们通常会乘以通道(和单元)的数量,直到达到所需的读取深度。为了获得最佳固定效果,在FA固定之前,应用PBS替换含血清的培养基,并应立即添加固定剂溶液,且没有浓度梯度15,22。对于细胞收获,刮擦优于胰蛋白酶消化,因为胰蛋白酶消化后从扁平到球形的转变可能会影响核构象。加入DSG后,松散和团块状细胞沉淀容易丢失。在此阶段处理细胞时要小心,并添加0.05%的BSA以减少结块。
对方法的修改
该协议是使用人类细胞17开发的。然而,根据染色体构象捕获的经验,该方案应该适用于大多数真核细胞。对于显着较低的输入(~1×106 个细胞),我们建议使用一半的体积进行裂解和构象捕获程序[步骤2.1-2.4]。这也将允许在带有1.7 mL管的台式离心机中进行DNA分离[步骤2.5],这可以改善低DNA浓度的沉淀。DNA的定量(步骤2.6.6)将指示如何进行。对于少量分离的DNA(1-5μg),我们建议跳过大小选择(步骤3.3),并在使用CFU将体积从130μL减少到~45μL后继续去除生物素。
该协议是专门为确保随后与FA和DSG交联以及与DpnII和DdeI消化后的高质量数据而开发的。然而,替代交联策略,如FA和EGS(乙二醇双(琥珀酸琥珀酰亚胺酯)),也用于ChIP-seq23 和ChIA-PET24,可能同样有效17。同样,不同的酶组合,如DpnII和HinfI18 或MboI,MseI和NlaIII19 可用于消化。在调整酶组合时,请务必使用可以填充特定 5' 突出部的生物素化核苷酸,并为每种鸡尾酒使用最佳缓冲液。DpnII 自带缓冲液,酶制造商推荐使用 DdeI 消解的特定缓冲液。然而,对于该方案中使用DpnII和DdeI的双重酶切,建议使用限制性缓冲液,因为它对两种酶的额定活性为100%。
构象捕获故障排除
染色体构象捕获的三个关键步骤:交联、消化和连接,在凝胶上可视化结果之前已经完成。为了确定这三个步骤中每个步骤的质量并识别可能出现问题的位置,在消化(CI)和消化(DC)之前和之后取等分试样,并与连接的Hi-C样品一起加载到凝胶上(图2)。该凝胶用于确定Hi-C样品的质量以及是否值得继续使用该方案。如果没有CI和DC,就很难确定潜在的次优步骤。值得注意的是,次优连接可能是由于连接本身、填充或交联问题造成的。要排除交联故障,请确保每个文库使用不超过1×107 个细胞,并从新鲜交联试剂和清洁细胞(即用PBS冲洗)开始。对于连接,请确保将细胞和连接混合物保存在冰上。在16°C孵育4小时之前加入T4 DNA连接酶并充分混合。
库准备疑难解答
如果需要超过10个PCR循环或在PCR滴定后凝胶上看不到PCR产物(图4),则有几种选择可以保存Hi-C样品。从PCR滴定回来,第一种选择是再次尝试PCR。如果仍然没有足够的产品,可以在用1x TLE缓冲液洗涤磁珠两次后尝试另一轮A尾和适配器连接(步骤3.6)。在这种额外的A尾和适配器连接之后,可以像以前一样进行PCR滴定。如果仍然没有产品,最后一个选择是重新分配步骤 3.3 中的 0.8x 分数并从那里继续。
Hi-C3.0的局限性和优势
重要的是要认识到Hi-C是一种基于群体的方法,可以捕获细胞群中位点对之间相互作用的平均频率。一些计算分析旨在从群体25中解开构象组合,但原则上,Hi-C对细胞之间的差异视而不见。虽然可以执行单细胞Hi-C 26,27并且可以进行计算推理28,但单细胞Hi-C不适合获得超高分辨率的3C信息。Hi-C 的另一个限制是它只检测成对交互。为了检测多触点相互作用,可以使用频繁的切割机结合短读长测序(Illumina)16,或者使用来自PacBio或Oxford Nanopore平台的长读长测序进行多接触3C29或4C30。还开发了专门检测姐妹染色单体之间和沿姊妹染色单体接触的Hi-C衍生物31,32。
尽管Hi-C19和Micro-C33可用于生成亚千碱基分辨率的接触图,但两者都需要大量的测序读取,这可能成为一项昂贵的工作。为了在不花费成本的情况下获得相似甚至更高的分辨率,可以应用特定基因组区域(捕获-C 34)或特定蛋白质相互作用(ChiA-PET 35,PLAC-seq36,Hi-ChIP37)的富集。这些富集应用程序的优缺点是仅对有限数量的交互进行采样。有了这样的丰富,Hi-C的全局方面(以及全局规范化的选择)就失去了。
Hi-C3.0的重要性和潜在应用
该协议旨在实现高分辨率、超深 3C,同时检测大规模折叠特征,如 TAD 和隔室17 (图 6)。该协议从每个Hi-C文库的每个管5个×10个6个细胞 开始,这应该有足够的材料对流通池上的一个或两个泳道进行测序,以获得多达10亿个配对端读取。对于超深测序,应制备多管5×106 细胞,具体取决于映射读段的数量和PCR重复数。在最高分辨率(<1 kb)下,CTCF位点之间主要发现环状相互作用,但也可以检测到启动子-增强子相互作用。读者可以参考Akgol Oksuz等人17 ,了解数据分析的详细说明。
作者没有利益冲突需要披露。
我们要感谢Denis Lafontaine的协议开发和Sergey Venev的生物信息学帮助。这项工作得到了美国国立卫生研究院共同基金4D核组计划对JD的资助(U54-DK107980,UM1-HG011536)。J.D.是霍华德休斯医学研究所的研究员。
本文受 HHMI 的出版物开放获取政策的约束。HHMI实验室负责人此前已向公众授予非排他性CC BY 4.0许可证,并在其研究文章中向HHMI授予可再许可许可证。根据这些许可证,本文作者接受的手稿可以在出版后立即在CC BY 4.0许可证下免费提供。
Name | Company | Catalog Number | Comments |
1 kb Ladder | New England Biolabs | N3232L | |
Agarose | Invitrogen | 16500100 | |
Agencourt AMPure XP magnetic beads , 60 mL | Beckman Coulter | A63881 | |
Amicon Ultra-0.5 Centrifugal Filter Unit (CFU) | EMD Millipore | UFC500396 | |
Annealing Buffer (5x) | See recipe in supplemental materials | ||
ATP 10 mM | ThermoFisher | R0441 | |
Avanti J-25i High Speed Refrigerated ultra-centrifuge | Beckman Coulter | ||
beckman ultracentrifuge tube 35 mL | Beckman Coulter | 357002 | |
Binding Buffer (2x) | See recipe in supplemental materials | ||
biotin-14-dATP 0.4 mM | Invitrogen | 19524-016 | |
BSA 10 mg/mL | New England Biolabs | B9000S | dilute from 20 mg/mL |
Cell scraper | Falcon | 353089 | |
Cell scraper | Corning | 3008 | |
Conical polypropylene tubes 50 mL | Denville | C1062-P | |
Conical tube 15 mL | Denville | C1017-P | |
Covaris micro tube AFA fiber with snap-cap 130 µL | Covaris | 520045/520077 | |
Covaris Sonicator | Covaris | E220/E220evolution/M220 | |
Culture flask 175 cm2 | Falcon | 353112 | |
Culture plates 150 mm x 25 mm | Corning | 430599 | |
dATP 1 mM | Invitrogen | 56172 | |
dATP 10 mM | Invitrogen | 56172 | |
dCTP 10 mM | Invitrogen | 56173 | |
DdeI | New England Biolabs | R0175L | |
dGTP 10 mM | Invitrogen | 56174 | |
DMSO | Sigma | D2650-5x10ML | |
dNTP mix 25 mM | Invitrogen | 10297117 | |
Dounce homogenizer | DWK Life Sciences | 8853010002/8853030002 | |
DPBS | Gibco | 14190-144 | |
DpnII | New England Biolabs | R0543M | |
DSG | ThermoScientific | 20593 | |
dTTP 10 mM | Invitrogen | 56175 | |
Ethanol 70% | Fisher | A409-4 | Diluted from 100% |
Ethidium Bromide | Fisher | BP1302-10 | |
Formaldehyde (37%) | Fisher | BP531-500 | |
Gel loading dye (6x ) | New England Biolabs | B7024S | |
Glycine in ultrapure water 2.5 M | Sigma | G8898-1KG | |
HBSS | Gibco | 14025-092 | |
Igepal CA-630 detergent | MP Biomedicals | 198596 | |
Klenow DNA polymerase 5 U/µL | New England Biolabs | M0210L | |
Klenow Fragment 3-->5’ exo-, 5 U/µL | New England Biolabs | M0212L | |
ligation buffer (10x) | New England Biolabs | B7203S | |
Liquid nitrogen | |||
LoBind microcentrifuge tube 1.7 mL | Eppendorf | 22431021 | |
Low Molecular Weight DNA Ladder | New England Biolabs | N3233L | |
Lysis buffer | See recipe in supplemental materials | ||
Magnetic Particle separator | ThermoFisher | 12321D | |
Microfuge tubes 1.7 mL | Axygen | MCT-175-C | |
MyOne Streptavidin C1 beads | Invitrogen | 65001 | |
NEBuffer 2.1 (10x) | New England Biolabs | B7002S | |
NEBuffer 3.1 (10x) | New England Biolabs | B7203S | |
PBS | Gibco | 70013-032 | |
PCR (strip) tubes | Biorad | TBS0201/ TCS0803 | |
PCR thermocycler | Biorad | T100 | |
Pfu Ultra II Buffer (10x) | Agilent | Comes with Pfu Ultra | |
PfuUltra II Fusion HS DNA Polymerase | Agilent | 600674 | |
Phase lock tube 15 mL | Qiagen | 129065 | |
Phase lock tubes 2 mL | Qiagen | 129056 | |
Phenol:chloroform:isoamyl alcohol | Invitrogen | 15593-049 | |
Protease inhibitor cocktail | ThermoFisher | 78440 | |
Proteinase K in ultrapure water 10 mg/mL | Invitrogen | 25530-031 | |
Refrigerated Centrifuge | Eppendorf | 5810R | |
RNase A, DNase and protease-free 10 mg/mL | Thermo Scientific | EN0531 | |
Rotator | Argos technologies | EW-04397-40 or rocking platform | |
SDS 1% | Fisher | BP13111 | |
Sodium acetate pH = 5.2, 3 M | Sigma | ||
Sub-Cell GT Horizontal Electrophoresis System | Biorad | 1704401 | |
T4 DNA ligase 1 U/µL | Invitrogen | 100004817 | |
T4 DNA polymerase | New England Biolabs | M0203L | |
T4 DNA polymerase | New England Biolabs | M0203L | |
T4 DNA polymerase 3 U/µL | New England Biolabs | M0203L | |
T4 ligation buffer (5x) | Invitrogen | Y90001 | |
T4 polynucleotide kinase 10 U/µL | New England Biolabs | M0201L | |
Tabletop centrifuge | Eppendorf | 5425 | |
TBE buffer | See recipe in supplemental materials | ||
Tris Low EDTA Buffer (TLE) | See recipe in supplemental materials | ||
Triton X-100 (10%) | Sigma | 93443 | |
Truseq adapter oligos | Integrated DNA Technologies (IDT)) | https://www.idtdna.com/site/order/oligoentry | 250 nmole and HPLC purified |
Tween 20 detergent | Fisher | 9005-64-5 | |
Tween Wash Buffer | See recipe in supplemental materials | ||
Vortex | Scientific Industries | (G560)SI-0236 |
请求许可使用此 JoVE 文章的文本或图形
请求许可This article has been published
Video Coming Soon
版权所属 © 2025 MyJoVE 公司版权所有,本公司不涉及任何医疗业务和医疗服务。