Для просмотра этого контента требуется подписка на Jove Войдите в систему или начните бесплатную пробную версию.
Method Article
* Эти авторы внесли равный вклад
We present a strategic plan and protocol for identifying non-coding genetic variants affecting transcription factor (TF) DNA binding. A detailed experimental protocol is provided for electrophoretic mobility shift assay (EMSA) and DNA affinity precipitation assay (DAPA) analysis of genotype-dependent TF DNA binding.
Population and family-based genetic studies typically result in the identification of genetic variants that are statistically associated with a clinical disease or phenotype. For many diseases and traits, most variants are non-coding, and are thus likely to act by impacting subtle, comparatively hard to predict mechanisms controlling gene expression. Here, we describe a general strategic approach to prioritize non-coding variants, and screen them for their function. This approach involves computational prioritization using functional genomic databases followed by experimental analysis of differential binding of transcription factors (TFs) to risk and non-risk alleles. For both electrophoretic mobility shift assay (EMSA) and DNA affinity precipitation assay (DAPA) analysis of genetic variants, a synthetic DNA oligonucleotide (oligo) is used to identify factors in the nuclear lysate of disease or phenotype-relevant cells. For EMSA, the oligonucleotides with or without bound nuclear factors (often TFs) are analyzed by non-denaturing electrophoresis on a tris-borate-EDTA (TBE) polyacrylamide gel. For DAPA, the oligonucleotides are bound to a magnetic column and the nuclear factors that specifically bind the DNA sequence are eluted and analyzed through mass spectrometry or with a reducing sodium dodecyl sulfate polyacrylamide gel electrophoresis (SDS-PAGE) followed by Western blot analysis. This general approach can be widely used to study the function of non-coding genetic variants associated with any disease, trait, or phenotype.
Секвенирования и генотипирования на основе исследований, включая геномные исследования ассоциации (GWAS), кандидат исследований локуса, и глубокие секвенирования исследования, выявили множество генетических вариантов, которые статистически связаны с заболеванием, признаком, или фенотипа. Вопреки ранних предсказаний, большинство из этих вариантов (85-93%) расположены в некодирующих областей и не изменяют аминокислотную последовательность белков 1,2. Интерпретируя функции этих некодирующих вариантов и определения биологических механизмов , связывающих их с сопутствующей болезни, признак или фенотип оказался непростым 3-6. Мы разработали общую стратегию для выявления молекулярных механизмов, связывающих варианты к важному промежуточного фенотипа - экспрессии генов. Этот трубопровод разработан специально для идентификации модуляции TF связывания генетических вариантов. Эта стратегия сочетает в себе вычислительные подходы и методы молекулярной биологии, направленных предсказатьбиологические эффекты вариантов кандидатов в силикомарганца, и проверить эти предсказания эмпирически (рисунок 1).
Рисунок 1:.. Стратегический подход для анализа некодирующих генетические варианты шагов, которые не включены в подробный протокол , связанный с этой рукописи заштрихованы серым цветом Пожалуйста , нажмите здесь , чтобы посмотреть увеличенную версию этой фигуры.
Во многих случаях, важно, чтобы начать путем расширения списка вариантов, чтобы включить все те, в высокой рычажной-неравновесия (LD) с каждым статистически связанным вариантом. ЛД является мерой неслучайной ассоциации аллелей двух различных хромосомных положениях, которые могут быть измерены с помощью R 2 статистики 7. R 2 представляет собой меру линКейдж неравновесие между двумя вариантами, с R 2 = 1 , обозначающее совершенной связи между двумя вариантами. Аллели в высокой LD оказываются совместно разделять на хромосоме через родовые популяции. Современные генотипирования массивы не включают в себя все известные варианты в геноме человека. Вместо этого они используют ЛД внутри генома человека и включают в себя подмножество известных вариантов , которые действуют в качестве прокси для других вариантов в пределах определенной области LD 8. Таким образом, вариант без какого-либо биологического последствие может быть связан с конкретным заболеванием, потому что это в LD с причинным вариантом: вариант с значимого биологического эффекта. С процедурной точки зрения рекомендуется преобразовать последний выпуск 1000 геномов проекта 9 файлов вариант вызова (VCF) в двоичные файлы , совместимые с Plink 10,11, инструмент с открытым исходным кодом для анализа всего генома ассоциации. Впоследствии все другие генетические варианты с LD г 2> 0,8 с каждым входом генетической ваRiant могут быть идентифицированы в качестве кандидатов. Важно использовать соответствующий ссылочный населения для этого , например , Step - , если вариант был выявлен у пациентов европейского происхождения, данные от субъектов аналогичного происхождения должны быть использованы для расширения LD.
Расширение LD часто приводит десятки вариантов кандидатов, и вполне вероятно, что лишь небольшая часть из них внести свой вклад в механизм заболевания. Часто, это неосуществимо экспериментально исследовать каждый из этих вариантов по отдельности. Поэтому полезно использовать тысячи доступных функциональных публично геномных наборов данных в качестве фильтра для определения приоритетности вариантов. Например, КОДИРОВАНИЯ консорциум 12 выполнил тысячи чиповых-сл экспериментов , описывающих связывание ТФ и сопутствующих факторов и гистонов марок в широком диапазоне контекстов, наряду с данными хроматина доступности от технологий , таких как ДНКазы сл 13, ATAC -seq 14 и FAIRE-15 сл. Databтузы и веб - серверы , такие как браузера УСК генома 16, Дорожная карта Epigenomics 17 Blueprint эпигеном 18, Cistrome 19 и ReMap 20 обеспечивают свободный доступ к данным , полученных с помощью этих и других экспериментальных методов в широком диапазоне типов и условий клеток. Когда есть слишком много вариантов, чтобы проверить экспериментально, эти данные могут быть использованы для приоритеты тех, которые находятся в пределах возможных регуляторных областей в соответствующих тканей и клеток типов. Кроме того, в тех случаях, когда вариант в микросхеме-сл пика для специфического белка, эти данные могут обеспечить потенциальных клиентов, как к специфическому TF (ами) или кофакторов, связывание может затрагивающий.
Далее, полученные по приоритетам варианты экспериментально скринингу для проверки связывания с использованием EMSA 21,22 предсказанную генотип-зависимого белка. EMSA измеряет изменение миграции олиго на невосстановительной геле КЭ. Флуоресцентно меченных олиго инкубируют сядерный лизат, и связывание ядерных факторов замедлит движение олиго на геле. Таким образом, олиго-, который связан больше ядерных факторов представит в качестве более сильного флуоресцентного сигнала при сканировании. Следует отметить, что EMSA не требует предсказания о специфических белков, связывание будут затронуты.
После того, как варианты идентифицируются, которые расположены в пределах прогнозируемых регуляторных областей и способны дифференцированно связывания ядерных факторов, вычислительные методы используются для прогнозирования конкретный TF (ы), связывание которого они могут повлиять. Мы предпочитаем использовать CIS-BP 23,24, RegulomeDB 25, UNIProbe 26 и 27 Джаспер. После того, как кандидат ТФ определены, эти прогнозы могут быть специально протестированы с использованием антител против этих ТФ (EMSA-supershifts и Dapa-вестерны). EMSA-supershift включает добавление антитела к TF специфичные к ядерной лизата и олиго. Положительный результат в EMSA-supershift является магнезииesented как дальнейший сдвиг в полосе EMSA или потери полосы (обзор в ссылке 28). В дополнительном Dapa, 5'-биотинилированные олиго дуплекс, содержащий вариант и 20 пар оснований нуклеотидов фланговый инкубируют с ядерными лизата из соответствующего типа (ов) клеток, чтобы захватить любые ядерные факторы, специфически связывающих олигонуклеотидов. Фактор-комплекс олиго дуплексной ядерная скованной стрептавидином микрогранулы в магнитном колонке. Связанные ядерные факторы собираются непосредственно через элюирования 29,48. Связующие предсказания затем могут быть оценены с помощью Вестерн-блоттинга с использованием антител, специфичных к белку. В тех случаях, когда нет никаких очевидных предсказаний, или слишком много прогнозов, то элюции из вариантов отжимания экспериментов Dapa могут быть отправлены в активную зону протеомики для выявления кандидатов ТФ с использованием масс-спектрометрии, которые впоследствии могут быть проверены с помощью этих ранее описанных методы.
В оставшейся части статьи обе, подробный протокол для EMSA и Dapa анализа генетических вариантов предусмотрена.
1. Preparation of Solutions and Reagents
Name | Sequence |
rs76562819_REF_FOR | GTAATGCCTTAATGAGAGAGAGTTAGTCATCTTCTCACTTC |
rs76562819_REF_REV | GAAGTGAGAAGATGACTAACTCTCTCTCATTAAGGCATTAC |
rs76562819_NONREF_FOR | GTAATGCCTTAATGAGAGAGGGTTAGTCATCTTCTCACTTC |
rs76562819_NONREF_REV | GAAGTGAGAAGATGACTAACCCTCTCTCATTAAGGCATTAC |
Table 1: Example EMSA/DAPA oligonucleotide design to test a SNP for differential binding. "REF" stands for the reference allele, while "NONREF" stands for the non-reference allele. "FOR" stands for the forward strand, while "REV" indicates its complement. The SNP is seen in red.
2. Preparation of Nuclear Lysate from Cultured Cells
Note: This experimental protocol was optimized using B-lymphoblastoid cell lines, but has been tested in several other unrelated adherent/ suspension cell lines and works universally.
3. Electrophoretic Mobility Shift Assay (EMSA)
Reagent | Final Conc. | Rxn #1 | Rxn #2 | Rxn #3 | Rxn #4 |
Ultrapure Water | to 20 µl vol. | 13.5 µl | 11.98 µl | 13.5µl | 11.98 µl |
10x Binding Buffer | 1x | 2 μl | 2 μl | 2 μl | 2 µl |
DTT/TW-20 | 1x | 2 μl | 2 μl | 2 μl | 2 μl |
Salmon Sperm DNA | 500 ng/μl | 0.5 μl | 0.5 μl | 0.5 μl | 0.5 μl |
1μg/μl Poly d(I-C) | 1 μg | 1 μl | 1 μl | 1 μl | 1 μl |
Nuclear Extract (5.26 ug/µl) | 8 μg | - | 1.52 μl | - | 1.52 μl |
NE Buffer | 1.52 μl | - | 1.52 μl | - | |
Reference allele oligo | 50 fmol | 1 μl | 1 μl | - | - |
Non-Reference allele oligo | 50 fmol | - | - | 1 μl | 1 μl |
Table 2: Example EMSA reaction setup. The table illustrates an example EMSA to test the hypothesis that there is genotype-dependent binding of TFs to a specific SNP.
4. DNA Affinity Purification Assay (DAPA)
In this section, representative results of what to expect are provided when performing an EMSA or DAPA, and the variability with regards to the quality of lysate is characterized. For example, it has been suggested that freezing and thawing protein samples multiple times may result in denaturation. In order to explore the reproducibility of EMSA analysis in the context of these "freeze-thaw" cycles, two 35 bp oligos differing at one genetic variant were incubated with a single bat...
Although advances in sequencing and genotyping technologies have greatly enhanced our capacity to identify genetic variants associated with disease, our ability to understand the functional mechanisms impacted by these variants is lagging. A major source of the problem is that many disease-associated variants are located in n on-coding regions of the genome, which likely affect harder-to-predict mechanisms controlling gene expression. Here, we present a protocol based on the EMSA and DAPA techniques, valuable molecular t...
The authors have nothing to disclose.
We thank Erin Zoller, Jessica Bene, and Lindsey Hays for input and direction in protocol development. MTW was supported in part by NIH R21 HG008186 and a Trustee Award grant from the Cincinnati Children's Hospital Research Foundation. ZHP was supported in part by T32 GM063483-13.
Name | Company | Catalog Number | Comments |
Custom DNA Oligonucleotides | Integrated DNA Technologies | http://www.idtdna.com/site/order/oligoentry | |
Potassium Chloride | Fisher Scientific | BP366-500 | KCl, for CE buffer |
HEPES (1 M) | Fisher Scientific | 15630-080 | For CE and NE buffer |
EDTA (0.5M), pH 8.0 | Life Technologies | R1021 | For CE, NE, and annealing buffer |
Sodium Chloride | Fisher Scientific | BP358-1 | NaCl, for NE buffer |
Tris-HCl (1M), pH 8.0 | Invitrogen | BP1756-100 | For annealing buffer |
Phosphate Buffered Saline (1x) | Fisher Scientific | MT21040CM | PBS, for cell wash |
DL-Dithiothreitol solution (1 M) | Sigma | 646563 | Reducing agent |
Protease Inhibitor Cocktail | Thermo Scientific | 87786 | Prevents catabolism of TFs |
Phosphatase Inhibitor Cocktail | Thermo Scientific | 78420 | Prevents dephosphorylation of TFs |
Nonidet P-40 Substitute | IBI Scientific | IB01140 | NP-40, for nuclear extraction |
BCA Protein Assay Kit | Thermo Scientific | 23225 | For measuring protein concentration |
Odyssey EMSA Buffer Kit | Licor | 829-07910 | Contains all necessary EMSA buffers |
TBE Gels, 6%, 12 Wells | Invitrogen | EC6265BOX | For EMSA |
TBE Buffer (10x) | Thermo Scientific | B52 | For EMSA |
FactorFinder Starting Kit | Miltenyi Biotec | 130-092-318 | Contains all necessary DAPA buffers |
Licor Odyssey CLx | Licor | Recommended scanner for DAPA/EMSA | |
Antibiotic-Antimycotic | Gibco | 15240-062 | Contains 10,000 units/ml of penicillin, 10,000 µg/ml of streptomycin, and 25 µg/ml of Fungizone® Antimycotic |
Fetal Bovine Serum | Gibco | 26140-079 | FBS, for culture media |
RPMI 1640 Medium | Gibco | 22400-071 | Contains L-glutamine and 25 mM HEPES |
Запросить разрешение на использование текста или рисунков этого JoVE статьи
Запросить разрешениеThis article has been published
Video Coming Soon
Авторские права © 2025 MyJoVE Corporation. Все права защищены