Method Article
В этом протоколе описывается метод Capture Hi-C, используемый для характеристики 3D-организации мегаразмерных целевых областей генома с высоким разрешением, включая границы топологически ассоциирующих доменов (TAD) и дальнодействующих взаимодействий хроматина между регуляторными и другими элементами последовательности ДНК.
Пространственная организация генома способствует его функции и регуляции во многих контекстах, включая транскрипцию, репликацию, рекомбинацию и репарацию. Поэтому понимание точной причинно-следственной связи между топологией и функцией генома имеет решающее значение и становится все более предметом интенсивных исследований. Технологии захвата конформации хромосом (3C) позволяют вывести трехмерную структуру хроматина путем измерения частоты взаимодействий между любыми областями генома. Здесь мы описываем быстрый и простой протокол для выполнения Capture Hi-C, метода обогащения мишеней на основе 3C, который характеризует аллель-специфическую 3D-организацию геномных мишеней мегабазового размера с высоким разрешением. В Capture Hi-C целевые области захватываются массивом биотинилированных зондов перед последующим высокопроизводительным секвенированием. Таким образом, достигается более высокое разрешение и аллель-специфичность при одновременном повышении эффективности времени и доступности технологии. Чтобы продемонстрировать свои сильные стороны, протокол Capture Hi-C был применен к мышиному центру Х-инактивации ( Xic), главному регуляторному локусу инактивации Х-хромосомы (XCI).
Линейный геном содержит всю информацию, необходимую организму для эмбрионального развития и выживания на протяжении всей взрослой жизни. Тем не менее, инструктирование генетически идентичных клеток выполнять различные функции имеет основополагающее значение для точного контроля того, какая информация используется в определенных контекстах, включая различные ткани и / или стадии развития. Считается, что трехмерная организация генома участвует в этой точной пространственно-временной регуляции активности генов, облегчая или предотвращая физическое взаимодействие между регуляторными элементами, которые могут быть разделены несколькими сотнями килобаз в линейном геноме (для обзоров 1,2,3). За последние 20 лет наше понимание взаимодействия между сворачиванием генома и активностью быстро возросло, в основном благодаря развитию технологий захвата конформации хромосом (3C) (для обзора 4,5,6,7). Эти методы измеряют частоту взаимодействий между любыми областями генома и полагаются на лигирование последовательностей ДНК, которые находятся в непосредственной 3D-близости внутри ядра. Наиболее распространенные протоколы 3C начинаются с фиксации клеточных популяций с помощью сшивающего агента, такого как формальдегид. Затем сшитый хроматин расщепляют с помощью фермента рестрикции, хотя также используется расщепление MNазы 8,9. После переваривания свободные концы ДНК в тесной пространственной близости повторно лигируются, и сшивание происходит в обратном порядке. Этот шаг приводит к появлению «библиотеки» или «шаблона» 3C, смешанного пула гибридных фрагментов, в котором последовательности, которые находились в 3D-близости к ядру, имеют более высокие шансы быть лигированными в одном и том же фрагменте ДНК. Последующая количественная оценка этих гибридных фрагментов позволяет вывести 3D-конформацию геномных областей, которые расположены на расстоянии тысяч пар оснований друг от друга в линейном геноме, но могут взаимодействовать в 3D-пространстве.
Для характеристики библиотеки 3C было разработано множество различных подходов, различающихся как с точки зрения того, какие подмножества фрагментов лигирования анализируются, так и с точки зрения того, какая технология используется для их последующей количественной оценки. Первоначальный протокол 3C основывался на выборе двух областей интереса и количественной оценке частоты их взаимодействия «один против одного» с помощью ПЦР10,11. Подход 4C (захват кольцевой конформации хромосомы) измеряет взаимодействие между одним интересующим локусом (т. е. «точкой зрения») и остальной частью генома («один против всех»)12,13,14. В 4C библиотека 3C подвергается второму раунду переваривания и перелигирования для получения небольших кольцевых молекул ДНК, которые амплифицированы ПЦР с помощью праймеров, специфичных для точки зрения15. 5C (точная копия захвата конформации хромосомы) позволяет характеризовать 3D-взаимодействия в более крупных областях, представляющих интерес, обеспечивая понимание сворачивания хроматина более высокого порядка в этой области («многие против многих»)16. В 5С библиотека 3С гибридизуется с пулом олигонуклеотидов, перекрывающих сайты рестрикции, которые впоследствии могут быть амплифицированы с помощью мультиплексной ПЦР с универсальными праймерами15. Как в 4C, так и в 5C информативные фрагменты ДНК были первоначально количественно определены с помощью микрочипов, а затем с помощью секвенирования следующего поколения (NGS)17,18,19. Эти стратегии характеризуют целевые области, представляющие интерес, но не могут быть применены для картирования полногеномных взаимодействий. Эта последняя цель достигается с помощью Hi-C, высокопроизводительной стратегии на основе 3C, в которой массовое параллельное секвенирование шаблона 3C позволяет объективно охарактеризовать сворачивание хроматина на уровне всего генома («все против всех»)20. Протокол Hi-C включает включение биотинилированного остатка на концах переваренных фрагментов, после чего следует вытягивание фрагментов лигирования шариками стрептавидина для увеличения извлечения лигированных фрагментов20.
Hi-C показал, что геномы млекопитающих структурно организованы в нескольких масштабах в 3D-ядре. В мегабазовом масштабе геном делится на области активного и неактивного хроматина, компартменты А и В, соответственно20,21. Существование дополнительных субкомпартментов, представленных различными состояниями хроматина и активности, также было впоследствии показано22. При более высоком разрешении геном далее разделяется на субмегабазовые самовзаимодействующие домены, называемые топологически ассоциирующими доменами (TAD), впервые выявленные при анализе Hi-C и 5C геномов человека и мыши23,24. В отличие от компартментов, которые варьируются тканеспецифическим образом, TAD, как правило, постоянны (хотя есть много исключений). Важно отметить, что границы TAD сохраняются для всех видов25. В клетках млекопитающих TAD часто охватывают гены, разделяющие один и тот же регуляторный ландшафт, и, как было показано, представляют собой структурную основу, которая облегчает корегуляцию генов, ограничивая взаимодействие с соседними регуляторными доменами (для обзора 3,26,27,28). Кроме того, в TAD взаимодействия, обусловленные сайтами CTCF в основании когезин-экструдированных петель, могут увеличивать вероятность взаимодействий промотор-энхансер или энхансер-энхансер (для обзора29).
В Hi-C компартменты и TAD могут быть обнаружены с разрешением от 1 Мб до 40 кб, но более высокое разрешение может быть достигнуто для характеристики контактов меньшего масштаба, таких как петлевые взаимодействия между дистальными элементами в масштабе 5-10 кб. Однако увеличение разрешения для эффективного обнаружения таких петель с помощью HiC требует значительного увеличения глубины секвенирования и, следовательно, затрат на секвенирование. Это усугубляется, если анализ должен быть аллель-специфическим. Действительно, X-кратное увеличение разрешения требует увеличения глубины секвенирования наX2 , а это означает, что подходы с высоким разрешением и аллель-специфическими для всего генома могут быть непомерно дорогими30.
Для повышения экономической эффективности и доступности при сохранении высокого разрешения целевые области, представляющие интерес, могут быть физически извлечены из полногеномных библиотек 3C или Hi-C после их гибридизации с комплементарными олигонуклеотидными зондами, меченными биотином, перед последующим секвенированием. Эти стратегии обогащения мишеней называются методами Capture-C и позволяют исследовать взаимодействия сотен целевых локусов, разбросанных по всему геному (т. е. Promoter Capture (PC) Hi-C; Захват нового поколения (NG) Capture-C; Захват с низким входом (LI); Ядерно-титрованный (NuTi) Capture-C; Tri-C)31,32,33,34,35,36,37,38,39,40 или между регионами, охватывающими до нескольких мегабаз (т. е. Capture HiC; HYbrid Capture Hi-C (Hi-C2); Плитка-С)41,42,43. Два аспекта могут различаться в методах, основанных на захвате: (1) природа и дизайн биотинилированных олигонуклеотидов (т.е. РНК или ДНК, одиночные олиго, захватывающие дисперсные геномные мишени, или несколько олиго, образующих интересующую область); и (2) шаблон, который используется для извлечения мишеней, которые могут быть библиотекой 3C или Hi-C, последняя состоит из биотинилированных фрагментов рестрикции, извлеченных из библиотеки 3C.
Здесь описан протокол Capture Hi-C, основанный на обогащении целевых контактов из библиотеки 3C. Протокол основан на разработке специально разработанного набора биотинилированных РНК-зондов и может быть выполнен за 1 неделю от подготовки библиотеки 3C до секвенирования NGS. Протокол быстрый, простой и позволяет охарактеризовать 3D-организацию более высокого порядка интересующих областей мегабазы с разрешением 5 кб, одновременно повышая эффективность времени и доступность по сравнению с другими методами 3C. Протокол Capture Hi-C был применен к главному регуляторному локусу инактивации Х-хромосомы (XCI), центру Х-инактивации (Xic), в котором находится некодирующая РНК Xist. Xic ранее был предметом обширного структурного и функционального анализа (для обзора44,45). У млекопитающих XCI компенсирует дозировку Х-сцепленных генов между самками (XX) и самцами (XY) и включает в себя подавление транскрипции почти всей одной из двух Х-хромосом в женских клетках. Xic представляет собой мощный, золотой стандарт локуса для исследований в области топологии 3D-генома и взаимодействия с регуляциейгенов 44. Анализ 5C Xic в эмбриональных стволовых клетках мыши (mESCs) привел к открытию и наименованию TAD, что позволило впервые понять функциональную значимость топологического разделения и корегуляции генов24. Впоследствии было показано, что топологическая организация Xic критически влияет на соответствующие сроки развития апрегуляции Xist и XCI 46, и неожиданные цис-регуляторные элементы, которые могут влиять на активность генов внутри и между TAD, также были недавно обнаружены в Xic47,48,49. Применение Capture Hi-C к 3 Мб Х-хромосомы мыши, охватывающей Xic, демонстрирует мощь этого подхода при анализе крупномасштабного сворачивания хроматина с высоким разрешением. Предоставляется подробный и простой для понимания протокол, начиная с разработки массива биотинилированных зондов на каждом сайте рестрикции DpnII в интересующей области до создания полногеномной библиотеки 3C, гибридизации и захвата целевых контактов и последующего анализа данных. Также включен обзор соответствующих мер контроля качества и ожидаемых результатов, а также обсуждаются как сильные, так и слабые стороны подхода в свете аналогичных существующих методов.
Эмбриональные стволовые клетки мыши (mESCs), использованные в этом исследовании, были получены в результате скрещивания самки TX/TX R26rtTA/rtTA 50 с самцом Mus musculus castaneus в соответствии с рекомендациями по уходу за животными Института Кюри (Париж)51.
1. Конструкция зонда
2. Экспериментальная процедура
3. Анализ данных
Описанный протокол Capture Hi-C основан на подготовке полногеномной 3C-матрицы с помощью четырехбазового резака (DpnII). Последующее обогащение фрагментов лигирования по интересующей области генома получается путем гибридизации массива тайлинговых РНК-зондов и их захвата на основе стрептавидина в соответствии с целевой системой обогащения, используемой в данном исследовании (рис. 1). Были выбраны биотинилированные РНК-зонды, поскольку они демонстрируют более плотное сродство к своим мишеням по сравнению с ДНК-зондами52,60. Затем захваченные библиотеки индексируются и объединяются в пулы для мультиплексирования с высокой пропускной способностью. Данные захвата Hi-C могут быть визуализированы в виде карт взаимодействия Hi-C с высоким разрешением, а также в виде карт контактов с одной точкой обзора в стиле 4C, чтобы специально визуализировать взаимодействия меньших последовательностей, таких как промоторы или усилители, во всей области захвата. Рабочий процесс протокола показан на рисунке 4. Контроль качества предварительного секвенирования показан на рисунке 2 и включает оценку правильного разложения и повторного лигирования шаблона 3C, а также его эффективную резку и очистку на различных этапах протокола. Ожидается, что срезанная матричная ДНК 3C будет работать в диапазоне от 150 до 700.н., и обогащение фрагментов >2 кб не должно быть обнаружено. Во время следующих этапов выполняется несколько этапов очистки ДНК на основе шариков и выбора размера, сначала после сдвига, затем после ПЦР до и после захвата. Очищенные библиотеки показывают отчетливый профиль обогащения фрагментов, визуализированный на высокочувствительном биоанализаторе ДНК (рис. 2). Средний размер фрагмента увеличивается в процессе подготовки библиотеки за счет лигирования адаптеров, секвенирования и индексации праймеров. Контроль качества после секвенирования осуществляется с помощью Hi-C Pro и показан на рисунке 3. Для обработки и анализа данных, подобных 3C, было предложено множество различных программных приложений для биоинформатики. Среди них конвейер HiC-Pro является одним из самых популярных решений, позволяющих обрабатывать необработанные данные секвенирования до конечных карт контактов при различных разрешениях55. HiC-Pro использует двухэтапную стратегию картирования для выравнивания чтений секвенирования в эталонном геноме. Затем продукты 3C реконструируются и отфильтровываются, чтобы удалить неинформативные пары контактов и создать карты контактов. Кроме того, он может использовать список известных полиморфизмов для проведения аллель-специфического анализа и разделения контактов, исходящих от двух родительских аллелей, в различных контактных картах. Совсем недавно HiC-Pro был включен и расширен в структуру nf-core (nf-core-hic), обеспечивая высокомасштабируемый и воспроизводимый конвейер, управляемый сообществом61,62.
Для захвата мыши Xic был разработан массив из 28 913 РНК-зондов, разбивающих 3 Мб Х-хромосомы. Эта область включает в себя ключевого игрока в XCI, длинный некодирующий ген Xist, и его известный регуляторный ландшафт ~ 800 кб (рис. 5). Эта область размером ~800 кб разделена на два TAD: один, включающий промотор Xist и его известные положительные регуляторы (т.е. некодирующие транскрипты Ftx, Jpx и Xert и ген, кодирующий белок Rnf12), и соседний TAD, охватывающий отрицательные цис-регуляторы Xist (т.е. его антисмысловой транскрипт Tsix, элемент энхансера Xite и некодирующий транскрипт Linx) (для обзора44,45).
Применив описанный протокол Capture Hi-C к Xic, топологическая организация этого локуса была получена с беспрецедентным разрешением (рис. 6 и рис. 7). Это особенно ясно при сравнении профиля Capture Hi-C с ранее опубликованным профилем 5C47 (рис. 6 и рис. 7; Дополнительная таблица 1) и Hi-C61 (рис. 6 и рис. 7; Дополнительная таблица 1) Профили. Например, структуры суб-TAD более очевидны — TAD, содержащий промотор Xist ( Xist-TAD ), четко подразделяется на два меньших домена (рис. 6A, синяя стрелка). Ранее об этом можно было только визуально «догадаться» по профилю 5С (рис. 6В), правда, обнаружение границы в этой области с помощью алгоритма оценки изоляции. Аналогичным образом, разрешение профиля Capture Hi-C позволяет идентифицировать два меньших домена в соседнем TAD (рис. 6A, B), который содержит промотор локуса Tsix ( Tsix-TAD ); ранее это не достигалось с помощью 5C (рис. 6B). Следует отметить, что топологические границы, определяемые оценкой изоляции по данным Capture Hi-C и 5C, обычно обнаруживаются в несколько разных местах и с разной относительной прочностью.
Более того, другие структуры суб-TAD, такие как контактные петли, хорошо видны из данных Capture Hi-C, такие как петля между Xist и Ftx (рис. 7A), ранее идентифицированная с Capture-C63, и петля между Xist и Xert (рис. 7B), недавно идентифицированная с использованием аналогичного протокола для Capture Hi-C48. Другие контакты также могут быть отображены более точно из-за увеличенного разрешения профилей Capture Hi-C, таких как те, которые образуют известные горячие точки контакта в Tsix-TAD между локусами Linx, Chic1 и Xite (рис. 7A).
По сравнению с данными Hi-C, показанными на рисунке 7, Capture Hi-C позволил увеличить разрешение в четыре раза, но потребовал только одну четвертую глубины секвенирования (т. е. 126 М считываний против 571 М) (Дополнительная таблица 1). Это увеличение разрешения позволяет обнаруживать субТАД и циклические взаимодействия, которые не могут быть обнаружены Hi-C на глубине секвенирования, показанной на рисунках 6 и 7. Таким образом, описанный протокол для Capture Hi-C позволяет получить гораздо более подробную характеристику с высоким разрешением большой интересующей области генома по сравнению с предыдущими подходами.
Рисунок 1: Конструкция зонда. Схематическое изображение стратегии, используемой для проектирования зонда. Области 300.н. вверх и вниз по течению от каждого сайта рестрикции DpnII в целевой области 3 Mb были выбраны и покрыты перекрывающимися биотинилированными РНК-зондами. Показан один из этих выбранных регионов, chrX: 102 474 805-102 475 500. В каждом зонде допускается не более 40 оснований повторяющихся последовательностей. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.
Рисунок 2: Контроль качества предварительного секвенирования Hi-C . (A) Репрезентативный пример контроля качества шаблонов 3C. 200 нг ДНК были загружены на 1% агарозный гель. Переулок 1: лестница 1 кб. Полоса 2: Непереваренный, сшитый и интактный хроматин работает в виде резкой полосы со скоростью >10 кб. Полоса 3: Сшитый хроматин, переваренный DpnII, представляет собой мазок размером от 1 до 3 кб. Полоса 4: Окончательная библиотека или шаблон 3C; свободные концы переваренных сшитых фрагментов ДНК перелигируются. Мазок ДНК с меньшим молекулярным размером практически не обнаруживается, а продукт лигирования обнаруживается в виде полосы размером >10 кб. (B) Репрезентативные примеры высокочувствительных профилей ДНК биоанализатора. Слева вверху: успешно срезанная библиотека 3C, показывающая распределение размера фрагмента от 150 до 700.н. Вверху справа: неудовлетворительно срезанная библиотека 3C. Несрезанная ДНК обнаруживается как широкое обогащение фрагментов >2 кб. (C) Внизу слева: срезанный образец ДНК после отбора размера левой стороны 1:1 с использованием шариков SPRI. Фрагменты ~300.н. обогащены. Нижняя середина: ПЦР-профиль предварительного захвата после лигирования адаптеров с парными концами в соответствии с протоколом производителя. Внизу справа: окончательная библиотека Capture Hi-C, включающая адаптеры, праймеры для секвенирования и индексирования для мультиплексного секвенирования. Сокращения: bp = пары оснований, FU = произвольная единица флуоресценции. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.
Рисунок 3: Захват контроля качества Hi-C после секвенирования с помощью HiC-Pro . (A) Пример скорости картирования эталонного генома для первого помощника пар секвенирования. Светло-голубая дробь представляет собой показания, выровненные HiC-Pro и охватывающие соединение лигирования. Таким образом, эта метрика может быть использована для проверки экспериментального этапа лигирования. (B) После того, как партнеры секвенирования выровнены в геноме, для анализа сохраняются только однозначно выровненные пары считывания. (C) Недопустимые пары (выделены красным цветом), такие как свисающий конец, автокруг или перевязка, исключаются из анализа. Доля допустимых пар является хорошим показателем эффективности лигирования и вытягивания. (D) Действительные пары могут быть дополнительно разделены на внутрихромосомные и ближние/дальние контакты. Дублированные пары чтения, которые, вероятно, представляют артефакты ПЦР, отбрасываются из анализа. (E) Для аллель-специфического анализа HiC-Pro сообщает о количестве аллельных считываний, поддерживаемых одним или двумя партнерами для каждого родительского генома (т.е. C57BL/6J x CASTEi/J). Ожидается одинаковая доля считываний, отнесенных к материнскому и отцовскому аллелю. (F) Наконец, для построения карт контактов выбираются только допустимые пары, перекрывающие область захвата. Пары захват-захват представляют контакты в целевом регионе, в то время как пары захват-репортер предполагают взаимодействие между целевым регионом и нецелевым регионом. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.
Рисунок 4: Рабочий процесс протокола Capture Hi-C. Схематическое изображение различных шагов протокола. Для создания полногеномного шаблона 3C хроматин сначала сшивают с формальдегидом, а затем расщепляют ферментом рестрикции DpnII. Затем свободные концы ДНК повторно лигируются, сшивание обращается вспять, и ДНК очищается. Чтобы обогатить фрагменты, охватывающие целевую область, массив биотинилированных РНК-зондов гибридизуют с матрицей 3C и захватывают с помощью стрептавидин-опосредованного вытягивания. Библиотеки захвата обрабатываются для мультиплексного секвенирования, а действительные фрагменты лигирования количественно оцениваются, чтобы определить частоту контактов хроматина по мишени, которые визуализируются в виде карт взаимодействия с высоким разрешением. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.
Рисунок 5: Обзор области, охватывающей Xic на Х-хромосоме мыши. Схематическое изображение Х-хромосомы мыши и увеличение захваченной области размером 3 Мб (ChrX: 102 475 000-105 475 000). Целевая область включает ~ 800 кб ДНК, соответствующей Xic, главному регуляторному локусу XCI. Xic включает в себя длинные некодирующие гены, Xist, ключевого игрока XCI, и его регуляторный ландшафт. Положительные регуляторы Xist показаны зеленым цветом, а отрицательные - фиолетовым. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.
Рисунок 6: Захват карт взаимодействия Hi-C, 5C и Hi-C в захваченной области размером 3 Мб. (A) Захват карты взаимодействия Hi-C целевого объекта размером 3 Мб, охватывающего Xic мыши с разрешением 10 кб (это исследование). (B) Карта взаимодействия 5C того же целевого региона, что и в A, с разрешением 6 кб (данные, обработанные из47). Повторяющиеся области, не включенные в анализы, замаскированы белым цветом. Данные 5C требуют собственной биоинформационной обработки (см.47). После очистки и выравнивания карты 5C с разрешением праймера объединяются с использованием бегущей медианы (окно = 30 кб, шаг = 5) для достижения окончательного разрешения 6 кб. (C) Карта взаимодействия Hi-C той же области генома, что и в A и B, с разрешением 40 кб (данные, обработанные из64). Все карты взаимодействия были сгенерированы с помощью ЭСК мыши. Оценка изоляции была рассчитана с помощью cooltools и представлена в виде гистограмм с минимумами изоляции на границах TAD. Границы TAD отображаются в виде вертикальных линий под картой. Высота каждой линии указывает на граничную прочность. Гены показаны в виде стрелок, указывающих в направлении транскрипции. Границы суб-TAD, которые определяются исключительно или более точно на картах Capture Hi-C, обозначаются пурпурными и синими стрелками для суб-TAD в Tsix и Xist TAD соответственно. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.
Рисунок 7: Захват карт взаимодействия Hi-C, 5C и Hi-C на 1 Мб в захваченной области. (A) Захват карты взаимодействия Hi-C геномной области размером 1 Мб, охватывающей Xic мыши, с разрешением 5 кб (это исследование). (B) Карта взаимодействия 5C той же области генома, что и в A. при разрешении 6 КБ (данные обработаны из47). Повторяющиеся области, не включенные в анализы, замаскированы белым цветом. Следует отметить, что данные 5C требуют собственной биоинформационной обработки (см.47). После очистки и выравнивания карты 5C с разрешением праймера объединяются с использованием бегущей медианы (окно = 30 кб, шаг = 5) для достижения окончательного разрешения 6 кб. (C) Карта взаимодействия Hi-C той же области генома, что и в A и B Hi-C, с разрешением 20 кб (данные, обработанные из64). Все карты взаимодействия были сгенерированы с помощью mESCs. Оценка изоляции была рассчитана с помощью cooltools и представлена в виде гистограмм с минимумами изоляции на границах TAD. Границы TAD отображаются в виде вертикальных линий под картой. Высота каждой линии указывает на граничную прочность. Гены показаны в виде стрелок, указывающих на направление транскрипции. Контактные петли, которые обнаруживаются исключительно или более точно в Capture Hi-C, обозначаются пурпурными и синими звездочками для петель в Tsix и Xist TAD соответственно. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.
Дополнительная таблица 1: Статистика после секвенирования для наборов данных, используемых в этой рукописи: Capture Hi-C (это исследование), Hi-C64 и 5C47. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.
Здесь мы описываем относительно быстрый и простой протокол Capture Hi-C для характеристики организации геномных областей мегабазового размера более высокого порядка при разрешении 5-10 кб. Capture Hi-C принадлежит к семейству технологий Capture-C, которые предназначены для обогащения целевых взаимодействий хроматина из полногеномных шаблонов 3C или Hi-C. На сегодняшний день подавляющее большинство приложений Capture-C было использовано для картирования хроматиновых контактов относительно небольших регуляторных элементов, разбросанных по всему геному. В первом протоколе Capture-C несколько перекрывающихся биотинилированных зондов РНК использовались для захвата >400 предварительно отобранных промоторов в библиотеках 3C, полученных из эритроидных клеток31. Та же стратегия была впоследствии усовершенствована в Next Generation (NG) и Nuclear Titrated (NuTi) Capture-C для достижения профилей взаимодействия с высоким разрешением >8,000 промоторов за счет использования одиночных приманок ДНК 120.н., охватывающих одиночные сайты рестрикции, и двух последовательных раундов захвата для максимального обогащения информативных фрагментов лигирования32,40. Эти стратегии привели к функциональному рассечению цис-действующих элементов во многих различных контекстах, включая эмбриональное развитие мыши, дифференцировку клеток, инактивацию Х-хромосомы и неправильную регуляцию генов при патологических состояниях 46,63,65,66,67,68,69,70,71.
В Promoter Capture Hi-C (PCHi-C) >22 000 аннотированных промоторов, содержащих фрагменты рестрикции, были извлечены из библиотек Hi-C путем гибридизации одиночных 120-мерных биотинилированных зондов РНК на одном или обоих концах фрагмента рестрикции34,72. Этот метод позволил рассечь интерактом тысяч промоторов в быстро растущем числе типов клеток, включая эмбриональные стволовые клетки мыши, клетки печени плода и адипоциты 34,35,72,73, а также лимфобластоидные линии человека, гемопоэтические предшественники, эпидермальные кератиноциты и плюрипотентные клетки 37,74,75,76,77.
По сравнению с этими технологиями целевого обогащения, Capture Hi-C нацелен на смежные области генома вплоть до мегабазового масштаба, тем самым охватывая один или несколько TAD и охватывая регуляторные ландшафты генов. Вся интересующая область должна быть покрыта массивом биотинилированных зондов, охватывающих каждый сайт рестрикции DpnII в мишени. Гибридизация биотинилированного массива с шаблоном 3C, его последующий захват на основе стрептавидина и обработка для мультиплексного секвенирования выполняются с использованием системы обогащения мишени для мультиплексного секвенирования Illumina Paired-End. Весь протокол является быстрым, так как он может быть выполнен за 1 неделю от подготовки библиотеки 3C до секвенирования NGS, и требует лишь незначительных адаптаций и/или устранения неполадок с учетом специфики.
Протокол также дает преимущества по сравнению с другими методами на основе 3C. Чтобы получить карты взаимодействия с разрешением 5-10 кб, мы секвенировали 100-120 М парных считываний. В качестве сравнения мы использовали здесь набор данных Hi-C из 571 млн чтений для достижения разрешения20 КБ 64 (GSM2053973), и потребовалось бы не менее 1 миллиарда чтений для достижения разрешения 5 КБ с Hi-C22 по всей хромосоме.
Захват Hi-C, используемый в настоящем исследовании, достигает гораздо более высокого разрешения, чем ранее опубликованный 5C на основе рестрикционного фермента47 6-bp (Дополнительная таблица 1). Важно отметить, что стратегия, разработанная для обогащения и усиления целевых взаимодействий в 5C, не позволяет проводить аллель-специфический анализ взаимодействий хроматина. Напротив, данные Capture Hi-C могут быть картированы в частности, в частности, что позволяет вскрывать 3D-структурные ландшафты пар гомологичных хромосом, например, в клетках человека или в гибридных клеточных линиях F1, полученных путем скрещивания генетически разных штаммовмышей 78. Для создания аллель-специфических карт взаимодействия Capture Hi-C с разрешением 5 кб мы секвенировали парные чтения 150.н., чтобы увеличить охват SNP. Аналогичные аллель-специфические подходы могут быть применены к клеточным линиям человека, для которых доступна аннотация SNP22.
Важно отметить, что, хотя Capture Hi-C обычно обеспечивает высокое разрешение при одновременном повышении доступности затрат на секвенирование, производство специально адаптированных биотинилированных олигонуклеотидов оказывает влияние на общую стоимость этого метода. Таким образом, выбор наиболее подходящего метода 3C будет отличаться для разных применений и будет зависеть от решаемого биологического вопроса и требуемого разрешения, а также от размера интересующей области. Другие разработанные протоколы Capture Hi-C имеют общие ключевые функции с протоколом, описанным здесь. Например, стратегия Capture Hi-C была применена для характеристики геномных областей размером от ~ 50 кб до 1 Мб, охватывающих некодирующие варианты, связанные с риском рака молочной железы и колоректального рака; в этом протоколе целевые области были извлечены из библиотек Hi-C путем гибридизации 120-мерных приманок РНК, покрывающих целевые области с 3-кратным покрытием33,38,79. Аналогичным образом, HYbrid Capture Hi-C (Hi-C 2) использовался для таргетинга взаимодействий в интересующих областях до2 Мб80. В обоих протоколах использование шаблона Hi-C, обогащенного фрагментами лигирования, вытянутыми биотином, увеличило процент общего информативного чтения по сравнению с нашим протоколом. Например, в наборе данных Hi-C, который мы использовали здесь для сравнения64 (GSM2053973), процент допустимых пар после удаления дубликатов в 4,8 раза выше, чем допустимые пары, полученные в Capture Hi-C, как описано на рисунке 3 и в дополнительной таблице 1. Тем не менее, последовательное вытягивание биотинилированных лигированных фрагментов и гибридизованных зондов делает протокол значительно более сложным и трудоемким, при этом, возможно, уменьшая сложность захваченной области.
Другим доступным методом обогащения 3C-шаблонов тайлинговыми зондами является Tiled-C, который был применен для изучения архитектуры хроматина с высоким пространственным и временным разрешением во время дифференцировки эритроидов мыши43. В Tiled-C панель из биотинилированных зондов 70.н. используется для обогащения контактов в крупномасштабных областях в двух последовательных раундах захвата для создания карт целевых взаимодействий с очень высоким разрешением43,81. Двойное обогащение захвата также делает протокол более длинным и сложным по сравнению с Capture Hi-C. Однако, в отличие от стратегий Capture-C, нацеленных на сайты с одним ограничением, в Tiled-C второй раунд захвата, по-видимому, существенно не повышает эффективность захвата, и поэтому, вероятно, может быть опущен43. Наконец, аналогичный подход к тайлингу, основанный на той же стратегии целевого обогащения, которая использовалась в этом исследовании, был применен к вскрытию регуляторных ландшафтов, охватывающих структурные варианты, описанные у пациентов с врожденными пороками развития и реконструированные у трансгенных мышей41,42. В этом случае тайловый массив зондов был спроектирован по всей цели, а не в непосредственной близости от участков41 ограничения DpnII. Тем не менее, эта работа была плодотворной в освещении чувствительности и мощи этой стратегии для достижения характеристики больших геномных областей с высоким разрешением в различных контекстах41,42,48.
В заключение, описанный здесь протокол представляет собой простую, надежную и мощную стратегию для 3D-характеристики с высоким разрешением любых интересующих областей генома. Применение этого подхода к различным модельным системам, типам клеток, регулируемым развитием хроматиновым ландшафтам и регуляции генов в здоровых и патологических состояниях, вероятно, облегчит наше понимание взаимодействия и причинно-следственной связи между топологией генома и регуляцией генов, что является одним из фундаментальных открытых вопросов в области эпигенетики. Кроме того, применение Capture Hi-C для картирования дальних взаимодействий и сворачивания хроматина более высокого порядка вариантов риска, выявленных в исследованиях GWAS, может выявить функциональную значимость некодирующих геномных локусов, связанных с заболеваниями человека в различных контекстах, тем самым обеспечивая новое понимание процессов, потенциально лежащих в основе патогенеза.
Кай Хаушульц (Kai Hauschulz) — специалист по полевым применениям в Agilent Technologies - Diagnostic and Genomics Group. Все остальные авторы заявляют об отсутствии конкурирующих интересов.
Работа в лаборатории Херда была поддержана премией Европейского исследовательского совета Advanced Investigator (XPRESS - AdG671027). А.Л. поддерживается индивидуальной стипендией Европейского Союза Марии Склодовской-Кюри (IF-838408). A.H. поддерживается инновационной и междисциплинарной сетью ITN ChromDesign в рамках грантового соглашения Марии Склодовской-Кюри 813327. Авторы благодарны Даниэлю Ибрагиму (MPI for Molecular Genetics, Берлин) за полезные технические советы, платформе NGS в Институте Кюри (Париж), а также Владимиру Бенешу и Центру геномики в EMBL (Гейдельберг) за поддержку и помощь.
Name | Company | Catalog Number | Comments |
10x PBS pH 7.4 | Gibco | 10010-023 | |
37% (vol/vol) paraformaldehyde solution | Electron Microscopy Sciences | 15686 | single use glass-vials; do not reuse |
50 mL PP conical tube | Falcon | 352070 | |
Agarose | Sigma | A9539-500g | |
Bioanalyzer | Agilent | G2939BA | |
Cell Scrapers - 25 cm Handle and 3.0 cm Blade | Falcon | 353089 | |
CHIR99021 | Axon Medchem BV | Axon 1386 | |
cOmplete Mini, Protease inhibitor cocktail (EDTA-free) | Merck | 11836170001 | |
Countess Cell Counting Chamber Slides | Invitrogen | C10228 | |
Countess II FL | Invitrogen | ZGEXSCCOUNTESS2FL | Automated cell counter |
Covaris S2 | Covaris | 500217 | Sonicator |
DNA LoBind tube, 1.5 mL | Eppendorf | 30108051 | |
DpnII (50000 units/mL) | New England Biolabs | R0543M | |
Dulbecco's Modified Eagle Medium (DMEM) | Merck | D6429 | |
Ethanol (100%) | Merck | 1.00983.2500 | |
Fetal Bovine Serum (FBS) | Thermo Scientific | 10270106 | |
gelatine from porcine skin | Sigma | G1890 | |
GeneRuler 1 kb Plus DNA Ladder | Thermo Scientific | SM0313 | |
GlycoBlue | Thermo Scientific | AM9516 | Coprecipitant |
High-Sensitivity Bioanlayzer chips | Agilent | 5067-4626 | |
Large Cooling Centrifuge 5920 R | Eppendorf | 5948000018 | |
leukaemia inhibitory factor (LIF) | Merck | ESG1107 | |
Liquiport | KNF | NF300 | Benchtop aspiration system |
Low-binding filter tips | Biozym | VT0260U, VT0240, VT0220, VT0200U | |
Molecular biology grade water | Merck | W3500-6x500ML | |
Next Seq 500 | Illumina | SY-415-1001 | |
Next Seq 500 High Output v2 Kit (300 cycles) | Illumina | FC-404-2004 | |
Nonidet P40 Substitute (NP40) | Merck | 11332473001 | |
PD0325901 | Axon Medchem BV | Axon 1408 | |
Protease inhibitor cocktail (EDTA-free) | Merck | 11873580001 | |
Proteinase K - recombinant, PCR-grade (20 mg/mL) | Thermo Scientific | EO0491 | |
Qubit 2.0 | Thermo Scientific | Q32871 | |
Qubit assay tubes | Thermo Scientific | Q32856 | |
Qubit dsDNA High Sensitivity kit | Thermo Scientific | Q32851 | |
RNase A (10 mg/mL) | Thermo Scientific | EN0531 | |
Sodium acetate pH 5.2 (3M) | Merck | S7899 | |
speed vacuum concentrator | Eppendorf | EP5305000100-1EA | |
Agencourt AMPureXP | Beckman Coulter | A63881 | SPRI beads |
SureSelect Target Enrichment Box 1 | Agilent | 5190-8645 | |
SureSelect Target Enrichment Kit ILM Indexing Hyb Module Box 2 | Agilent | 5190-4455 | |
SureSelect XT Library Prep Kit ILM | Agilent | 5500-0132 | |
T4 ligase (30 units/µL) | Thermo Scientific | EL0013 | |
table-top Centrifuge 5427 R | Eppendorf | 5409000012 | |
Triton-X-100 (500 mL) | Merck | X100-500ML | |
Trypan Blue | Invitrogen | T10282 | |
Trypsine | Thermo Scientific | 25300054 | |
UltraPure Glycine | Thermo Scientific | 15527013 | |
β-mercaptoethanol | Thermo Scientific | 31350010 |
Запросить разрешение на использование текста или рисунков этого JoVE статьи
Запросить разрешениеThis article has been published
Video Coming Soon
Авторские права © 2025 MyJoVE Corporation. Все права защищены