Method Article
* Diese Autoren haben gleichermaßen beigetragen
DNA-regulatorische Elementen, wie z. B. Enhancer, Steuern Genexpression durch Kontaktaufnahme mit körperlich Ziel Gen Promotoren, oft durch weiträumige chromosomalen Interaktionen über genomische Entfernungen. Promotor erfassen Hi-C (PCHi-C) identifiziert signifikante Wechselwirkungen zwischen Promotoren und distalen Regionen ermöglicht die Zuordnung von möglichen regulatorischen Sequenzen, deren Zielgene.
Die dreidimensionale Organisation des Genoms ist mit seiner Funktion verknüpft. Z. B. Steuern regulatorische Elemente wie transkriptionelle Enhancer, den räumlich-zeitlichen Ausdruck ihrer Zielgene durch körperlichen Kontakt, oft erhebliche (in einigen Fällen Hunderte von Kilobases) genomischen Entfernungen überbrücken und unter Umgehung nahe gelegenen Gene. Das menschliche Genom hegt eine geschätzte 1 Million Enhancer, die überwiegende Mehrheit davon haben unbekannte gen Ziele. Ihre Zielgene distalen regulatorische Regionen zuordnen ist daher wichtig zu verstehen, gen-Expressions. Wir entwickelten Promoter erfassen Hi-C (PCHi-C) ermöglichen die genomweite Detektion von distalen Promotor-Interaktion Regionen (PIRs), für alle Veranstalter in einem einzigen Experiment. In PCHi-C sind hochkomplexe Hi-C-Bibliotheken speziell für promotorsequenzen durch in-Lösung Hybrid-Auswahl mit Tausenden von biotinylierte RNA Köder komplementär zu den Enden alle Projektträger-haltigen Einschränkung Fragmente bereichert. Ziel ist es, dann Pulldown promotorsequenzen und ihre häufigen Interaktionspartnern wie Geschmacksverstärker und andere mögliche regulatorische Elemente. Nach hohem Durchsatz gepaart-End Sequenzierung wird ein statistischer Test jeder Veranstalter ligiert Beschränkungsfragment, bedeutende PIRs auf Beschränkung Fragment Ebene zu identifizieren. Wir haben PCHi-C verwendet, um einen Atlas der Langstrecken-Promoter Interaktionen in Dutzenden von Mensch und Maus Zelltypen zu generieren. Diese Veranstalter Interaktom Karten haben zu einem besseren Verständnis der Säugetier-gen-Expressions beigetragen, indem ihre Zielgene vermeintliche regulatorische Regionen zuordnen und bevorzugte räumliche Promotor-Promotor Interaktion Netze offenbart. Diese Information hat auch hohen Relevanz für das Verständnis menschlichen genetischen Krankheit und die Identifizierung von möglichen Krankheitsgenen, durch die Verknüpfung von nicht-kodierenden krankheitsassoziierten Varianten in oder in der Nähe von Sequenzen, deren Zielgene-Sequenz.
Sammeln Beweise legt nahe, dass die dreidimensionale Organisation des Genoms eine wichtige funktionelle Rolle in einer Reihe von atomaren Prozesse spielt, einschließlich gen Aktivierung1,2,3, Unterdrückung4 ,5,6,7,8, Rekombination9,10, DNA-Reparatur11, DNA-Replikation12,13, und zelluläre Seneszenz14. Entfernten Enhancer befinden sich in unmittelbarer räumlicher Nähe an die Projektträger, dass sie15,16,17, regulieren die für ordnungsgemäße Spatio-temporal gen-Expressions erforderlich ist. Enhancer Löschungen zeigen, dass die distale Enhancer für Ziel-gen Transkription18,19,20,21,22und "erzwungene Chromatin looping" zeigt, dass veränderter tethering zwischen Verstärker und ihre Ziel-Promoter in der Hbb -Lokus transkriptionelle Aktivierung23fahren ausreicht. Darüber hinaus können Genom Umgestaltungen, die Gene unter die Kontrolle der ektopische Enhancer bringen unangemessen Genaktivierung und Krankheit24,25,26führen. Zusammen, zeigen diese Beispiele, dass Veranstalter-Enhancer Interaktionen essentiell für gen-Kontrolle sind und erfordern strenge Regulierung um entsprechende Genexpression zu gewährleisten. Der Mensch und Maus Genome sind jeweils auf rund 1 Million Enhancer Hafen geschätzt. Für die überwiegende Mehrheit der diese Enhancer Zielgene sind unbekannt, und die "Rules Of Engagement" zwischen Promotoren und Geschmacksverstärker sind kaum erforscht. Ihre Zielgene transkriptionelle Enhancer zuweisen, bleibt somit eine große Herausforderung bei der Entschlüsselung Säugetier-gen-Expressions.
Unser Verständnis von dreidimensionalen Genom Architektur wurde durch die Einführung der 3 C27 (Chromosom Konformation Capture) und seine Varianten28,29,30,31 revolutioniert . Die mächtigsten dieser Techniken, Hi-C (Hochdurchsatz Chromosom Konformation Capture) soll das gesamte Ensemble der chromosomalen Interaktionen innerhalb einer Zellpopulation zu identifizieren. Hallo-C-Bibliotheken, in der Regel generiert aus Millionen von Zellen, sind sehr komplex, mit einer geschätzten 1011 unabhängige Ligatur Produkte zwischen ~ 4 kb Fragmente im menschlichen Genom32. Als eine Konsequenz, zuverlässige und reproduzierbare Ermittlung von Wechselwirkungen zwischen einzelnen Einschränkung (z. B. diejenigen, die ein Veranstalter oder Enhancer) aus Fragmenten ist Hi-C Daten nicht machbar, wenn Hi-C-Bibliotheken, Ultra-Tiefe Sequenzierung ausgesetzt sind, Das ist keine wirtschaftlich tragfähige Lösung für Labors routinemäßig Hi-C-Bibliotheken vorbereiten. Um dieses Manko zu umgehen, haben wir Promoter erfassen Hi-C bereichern speziell Promotor-haltigen Ligatur Produkte von Hi-C-Bibliotheken entwickelt. Wir konzentrieren auf Promotoren aus zwei Gründen. Zuerst Promotor-Enhancer Kontakte haben gezeigt, dass entscheidend für die richtige Gen Ausdruck Niveaus in zahlreichen Studien werden (siehe Verweise oben), und zweitens wie Promotoren weitgehend invariante zwischen Zelltypen sind, die gleichen Köder Bilderfassungssystem kann verwendet werden, zu befragen die regulatorischen Schaltung über mehrere Zelltypen und Bedingungen. Unser Ansatz beruht auf in-Lösung Hybridisierung von Hi-C-Bibliotheken mit Zehntausenden von biotinylierte RNA 120mers Promotor-haltigen Hi-C Ligatur Produkte und spätere Erfassung auf Streptavidin beschichteten magnetische Beads ergänzen. Dies führt in PCHi-C-Bibliotheken mit viel reduziert Komplexität im Vergleich zu der ursprünglichen Hi-C-Bibliothek, konzentriert sich nur auf die Identifizierung der Fragmente, die Projektträger bei signifikant hohen Frequenzen ligiert werden.
Wir haben PCHi-C in einer Reihe von Mensch und Maus Zelltypen dazu beitragen, ein besseres Verständnis der Gen-Expressions durch Aufdeckung Langstrecken distalen Promotor interagierenden Regionen mit vermeintlichen regulierende Funktion, als auch nicht-zufällige verwendet. Veranstalter-Promotor Kontakte im dreidimensionalen Raum des Kerns. Die Studien haben Hunderttausende von Promoter-Enhancer Kontakte zugeordnet, über zahlreiche Zelle Arten33,34,35,36,37,38, 39, Polycomb repressiven komplexe vermittelte räumliche Genom-Organisation in Maus embryonale Stammzellen7identifiziert, demonstriert umfangreiche Neuverkabelung der Veranstalter Interactomes während zellulare Unterscheidung37, 38 , 39, und verknüpften nicht-kodierende krankheitsassoziierten Sequenz Varianten bis Gen Promotoren35.
PCHi-C ist eine ideal Methode der genomweiten Ensemble von DNA-Sequenzen, die Interaktion mit den Projektträgern zuordnen. Ähnliche Ansätze, wie z. B. erfassen Hi-C kontinuierliche genomische Regionen (siehe Diskussion) sind die Methode der Wahl zur hochauflösenden Interaktion Profile für ausgewählte genomische Regionen zu erhalten. PCHi-C- und Hi-C zu erfassen sind sehr ähnlich aus einer experimentellen Sicht (der einzige Unterschied ist die Wahl der Capture-System), so dass die Ratschläge und Richtlinien wir bieten für beide Ansätze gelten. Hier präsentieren wir Ihnen eine detaillierte Beschreibung der PCHi-C. Wir skizzieren die Begründung und Gestaltung eines PCHi-C-Experiments, bieten eine schrittweise PCHi-C Bibliothek Generation Protokoll und veranschaulichen, wie die Qualität der PCHi-C-Bibliotheken bei verschiedenen Schritte im Protokoll zum qualitativ hochwertigen Daten liefern überwacht werden kann.
(1) Formaldehyd Fixierung
(2) Zell-Lyse
3. HindIII Verdauung
4. Biotinylierungen der Beschränkungsfragment Überhänge
(5) im Zellkern Ligation
6. Crosslink Umkehr
(7) DNA-Reinigung
(8) Qualitätskontrollen
(9) DNA-Fragmentierung
10. Double-sided SPRI-Bead Größenauswahl
11. Biotin/Streptavidin Pulldown-Ligation Produkte
12. Reparatur und Entfernung von Biotin an nicht ligiert DNA enden zu beenden
13. dATP Tailing
14.-Adapter Ligation
15. Hallo-C-Bibliothek Verstärkung
16. Hybrid-Lösung Capture
Hinweis: Blocker und Puffer (SHS1-4) die folgenden Lösungen sind aus der SureSelect kit (siehe Tabelle der Materialien).
17. Isolierung der Promoter Fragment-haltigen Ligation Produkte
Hinweis: Die folgenden Schritte sollten mit SureSelect-Adapter-Kit und Bibliothek (siehe Tabelle der Mat) erfolgen.
18. PCHi-C-Bibliothek Verstärkung
Promotor erfassen Hi-C wurde zur Maus7,34,36,39 und menschlichen33,35,37,38 Hi-C-Bibliotheken für bereichern Veranstalter-Interaktionen. Ein ähnliches Protokoll (benannt HiCap) wurde vom Sandberg Gruppe40beschrieben. Abbildung 1A zeigt den schematischen Workflow für Promoter erfassen Hi-C. In dem hier beschriebenen Protokoll sind Hi-C-Bibliotheken mit im Zellkern Ligatur41, führt zu einer deutlich reduzierten Anzahl von unechten Ligatur Produkte42erzeugt. Für PCHi-C hochkomplexe Maus oder menschlichen Hi-C-Bibliotheken in Lösung Hybridisierung unterliegen und mit 39.021 biotinylierte RNAs komplementär zu 22.225 Maus Promotor-haltigen HindIII Einschränkung Fragmente oder 37.608 biotinylierte RNAs zu erfassen 22.076 menschlichen Promotor-haltigen HindIII Einschränkung Fragmente, Ausrichtung bzw.. Projektträger mit Einschränkung Fragmente kann an einem oder beiden Enden durch individuelle biotinylierte RNAs (Abbildung 1 b) ausgerichtet werden. Wir fanden, dass die Aufnahme der beiden verbesserte Abdeckung der einzelnen Projektträger (Abbildung 1; roh Sequenz liest) fast zwei-Fach, endet, wie erwartet. Also, wann immer möglich (d. h. nicht wiederholende Regionen), wir empfehlen, biotinylierte RNAs komplementär zu beiden Enden ein Beschränkungsfragment erfasst werden.
Um PCHi-C-Bibliothek-Qualität in einem frühen Stadium während der Vorbereitung der Bibliothek zu beurteilen, führen wir zwei Steuerelemente nach DNA-Ligatur und Reinigung, wie zuvor beschrieben31. Die erste ist mit spezifischen Primer-Paaren um Ligatur Produkte wie 3 C27zu verstärken. Wir verwenden Grundierung Paare (Tabelle 1) Zelltyp invariante Langstrecken Ligatur Produkte zu verstärken, wie zwischen das Myc -gen und seine bekannten Enhancer befindet sich ca. 2 Mb entfernt (Abbildung 2A) oder zwischen den Genen der Hist1 Locus () (getrennt durch 1,5 Mb), und zwischen beiden Regionen befindet sich in der Nähe linear ("Short-Range Control").
Die zweite Qualitätskontrolle erfolgt die Effizienz von Biotin Einbau während Klenow-vermittelten Fill Einschränkung Website Überhänge mit Biotin-dATP bestimmen. Erfolgreiche Klenow füllen und anschließende stumpfe Ende Ligatur Ergebnisse in das Verschwinden der ursprünglichen Beschränkung Site zwischen den DNA-Molekülen einer Ligatur Ware und im Falle von HindIII bei der Bildung einer neuen NheI Anerkennung Website (Abb. 2 b ). Das Verhältnis von HindIII NheI verdaute Ligatur Produkt ist eine direkte Auslesen der Biotin-Aufnahme-Effizienz. Eine schlechte Qualität Hi-C-Bibliothek zeigen ein hohes Maß an HindIII Verdauung, während qualitativ hochwertige Bibliotheken verfügen über nahezu vollständigen NheI Verdauung der Ligatur Produkte (Abb. 2 b).
Nach Hi-C Bibliothek Vorbereitung (d. h. nach Biotin-Streptavidin herunterziehen Bildgröße Hi-C Ligatur Produkte, Adapter Ligatur und Pre-Capture-PCR) wird die Integrität und Größe Verteilung der Hi-C-Bibliothek von Bioanalyzer (Abbildung bewertet. 2 C). die gleiche Kontrolle erfolgt am Ende des PCHi-C Bibliothek Vorbereitung (d. h. nach der Hybridisierung Aufnahme der Promotor-haltigen Ligatur Produkte und Post-Capture-PCR). Vergleich der Hi-C und PCHi-C Bioanalyzer profile zeigt, dass erwartungsgemäß Hi-C-Bibliotheken viel konzentrierter als die entsprechenden PCHi-C-Bibliotheken sind, aber die Größenverteilung der Bibliotheken sehr ähnlich ist, angibt, die die Erfassung Schritt in PCHi-C vorstellen keinen Größe Bias (Abbildung 2, D).
Nach gepaart-End Sequenzierung der PCHi-C liest zugeordnet sind, Qualität kontrolliert und mit Hilfe der HiCUP Pipeline43gefiltert. Qualitativ hochwertige PCHi-C-Bibliotheken enthalten zwischen 70-90 % "gültige Paare" (d. h. gepaart-End Sequenz liest zwischen zwei Einschränkung-Fragmente, die nicht auf der linearen genomische Karte; benachbarten sind Abb. 3A, B). Mit Hilfe der im Zellkern Ligatur Protokoll41,42, Lesen der Anteil der Trans Sie Paare (d. h. gepaart-End Sequenz liest zwischen zwei Einschränkung-Fragmente, die auf verschiedenen Chromosomen befinden) in der Regel gering sind, zwischen 5 und 25 % Was die Existenz von Chromosom Territorien und zeigt gute Bibliothek Qualität. Direktvergleich der Prozentsatz von "gültigen Paare" zwischen Hi-C-Bibliotheken und ihre entsprechenden PCHi-C Bibliotheken35, zeigt, dass in allen Fällen den Anteil der gültigen Paare ist höher in der PCHi-C-Bibliotheken (Abb. 3 b). Damit einher geht eine Reduzierung des Anteils der ungültigen "dasselbe fragment interne" liest in PCHi-C (Abbildung 3). Es wird erwartet, wie der Aufnahme Schritt nicht nur für Veranstalter-haltigen Ligatur Produkte bereichert, sondern aufgrund der Position der Erfassung Oligos zur Beschränkung auch für Beschränkung Fragment endet, Fragmente (siehe Abbildung 1 b).
Nach HiCUP Filtern ermitteln wir die Capture-Effizienz. PCHi-C-Bibliotheken enthalten drei Arten des gültigen Reihenfolge lautet nach HiCUP filtern:
(1) Veranstalter: Genom liest (d. h. zwischen erfassten Promoter Fragment und ein nicht-Promotor HindIII Beschränkungsfragment überall im Genom mal gelesen)
(2) Veranstalter: Veranstalter liest (gelesen zwischen zwei erbeuteten promotorfragmente)
(3) Genom: Genom liest (Hintergrund Hi-C Ligatur Produkte wo weder die Ligatur Produktpartner mit einem erbeuteten Promotor Karten). Diese werden vor dem nachgeschalteten Analysen verworfen.
Qualitativ hochwertige PCHi-C-Bibliotheken haben Erfassung Leistungsfähigkeiten (Summe der Kategorien 1 und 2 oben) zwischen 65-90 % (Abbildung 3D). Ein direkter Vergleich zu Hi-C-Bibliotheken zeigt, dass PCHi-C ergibt sich eine ~ 15-fold Bereicherung für Promoter-haltigen Ligatur Produkte (Abbildung 3D), in einigen Fällen 17-fache. Dies ist in der Nähe das hypothetische Maximum (19.6-fold) Bereicherung für PCHi-C, die den Prozentsatz der Genom Einschränkung Fragmente abhängig ist von der Capture-System abgedeckt. Größere Bereicherung kann erreicht werden, indem Sie entwerfen Capture-Systeme gezielt weniger Beschränkung Fragmente44,45,46.
Analyse der Veranstalter Interactomes zeigt Zelle Art und Abstammung-Spezifität33,34,35, mit ausgeprägten Veränderungen während der Zelldifferenzierung37,38,39 . Abbildungen 4 und 5 zeigen Beispiele für Linie Spezifität und Differenzierung Dynamik bei bestimmten Promotoren. Z. B. ALAD ist konstitutiv in allen Zellen exprimiert, aber seinen Ausdruck ist hochreguliert in Erythroblasts47. Der Projektträger ALAD Kontakte mehrere distale Fragmente in allen hämatopoetischen Zellen und engagiert sich in zusätzliche Interaktionen speziell in Erythroblasts (Abbildung 4). IL-8 zeigt keine statistisch signifikanten Wechselwirkungen in B-Zellen, sehr wenige Interaktionen in T-Zellen, sondern Dutzende von Interaktionen in den Zellen der myeloischen Linie, einschließlich Zelltyp spezifische Wechselwirkungen in Monozyten, Neutrophilen und Megakaryozyten) ( Abbildung 5). Diese Beispiele zeigen, wie PCHi-C verwendet werden kann, um Zelltyp spezifische Interactomes zu entwirren und Promotor-Interaktion Regionen mit regulatorischen Potenzial zu identifizieren.
Abbildung 1 : Promoter erfassen Hi-C Begründung und Capture Köder Design. (A) schematische Workflow der PCHi-C. Im Kern Ligatur Hi-C41,42 (I) gefolgt von in-Lösung Hybridisierung mit biotinylierte RNA Köder (II) gezielt die Einschränkung Fragmente von allen menschlichen (hier abgebildet) oder Maus Gen Promotoren (III). (B) Köder Design für PCHi-C. Biotinylierte RNA Erfassung Köder (rote gebogene Linien) sollen an den Enden der Promotor-haltigen Einschränkung Fragmente (grau; beachten Sie, dass die promotorsequenzen selbst (rot) nur durch die RNA-Capture-Köder ausgerichtet sind, wenn sie an Einschränkung befinden Fragment-enden). Ligatur-Produkte bestehend aus Promotor-haltigen Einschränkung Fragmente (grau) und deren Interaktion Einschränkung Bruchstücke (gelb und grün) sind isolierte durch Sequenz-Komplementarität Hybridisierung zwischen Köder RNA und DNA-Ziel, und die anschließende Biotin-Streptavidin Pulldown, siehe A. (C) Vergleich der PCHi-C Capture Effizienz für Promoter-haltigen Einschränkung Fragmente gezielt durch eine RNA Köder Aufnahme Sonde Vs zwei RNA Köder erfassen Sensoren (siehe Schema b). Bitte klicken Sie hier für eine größere Version dieser Figur.
Abbildung 2 : PCHi-C Pre-Sequenzierung Qualitätskontrollen. (A) Links, schematische räumliche Gegenüberstellung zwischen Promotor und PIR, was zu einem Hi-C Ligatur Produkt bestehend aus einem Promotor-haltigen Beschränkungsfragment (grau; promotorsequenz in rot) und ein PIR Beschränkungsfragment (gelb). Recht, DNA-gel-Elektrophorese zeigt Beispiele von Hi-C-Ligatur-Produkte verstärkt mit spezifischen Primer-Paaren (wie im Schaltplan auf der linken Seite dargestellt). (B) Links, repräsentative Beispiele für HindIII, NheI und HindIII/NheI Einschränkung verdaut Hi-C Ligatur Produkte (PCR-Produkte in A gezeigt). Rechts, schematische Darstellung der DNA-Sequenz nach Hi-C Ligatur nach erfolglosen (oben) oder erfolgreiche (unten) dNTP Klenow Fill Einschränkung Kreuzungen und nachfolgende Ligatur. (C) Vertreter Hi-C Bioanalyzer Bibliotheksprofil (1/5 Verdünnung). (D) Vertreter PCHi-C Bibliothek Bioanalyzer Profil (keine Verdünnung). Bitte klicken Sie hier für eine größere Version dieser Figur.
Abbildung 3 : PCHi-C Post-Sequenzierung Qualitätskontrollen. (A) Vergleich der prozentualen gültigen Reihenfolge lesen Paare nach HiCUP43 Verarbeitung in PCHi-C gegen entsprechende Hi-C-Bibliotheken (Daten aus Javierre Et Al., 2016-35). (B) Vertreter HiCUP PCHi-C Ergebnis zeigt gültige lesen Paare und andere Sequenz-Kategorien, die vor dem nachgeschalteten Analysen (Daten aus Javierre Et Al., 201635) verworfen werden. (C) Vergleich der Prozentsatz "interne dasselbe Fragment" liest nach HiCUP Verarbeitung in PCHi-C gegen entsprechende Hi-C-Bibliotheken (Daten aus Javierre Et Al., 2016-35). (D) Vergleich der prozentualen Sequenz liest mit angehaltenem promotorfragmente (Capture Effizienz) in PCHi-C gegen entsprechende Hi-C-Bibliotheken (Daten aus Javierre Et Al., 2016-35). Bitte klicken Sie hier für eine größere Version dieser Figur.
Abbildung 4: ALAD PCHi-C-Profil in humanen hämatopoetischen Zellen. Promotor Interaktionen myeloiden Zelltypen sind als blaue Bögen und Projektträger Interaktionen des lymphatischen Zelltypen sind als Lila Bögen angezeigt. Erythroblast-spezifische Interaktionen werden durch rote Pfeile (Daten aus Javierre Et Al., 201635) angezeigt. Bitte klicken Sie hier für eine größere Version dieser Figur.
Abbildung 5 : IL8 PCHi-C-Profil in humanen hämatopoetischen Zellen. Promotor Interaktionen myeloiden Zelltypen sind als blaue Bögen und Projektträger Interaktionen des lymphatischen Zelltypen sind als Lila Bögen angezeigt. Monocyte-spezifische Interaktionen werden durch grüne Pfeile angedeutet, Neutrophilen-spezifischen Interaktionen sind durch rote Pfeile gekennzeichnet und eine Megakaryocyte-spezifische Interaktion wird durch einen braunen Pfeil (Daten aus Javierre Et Al., 201635) angezeigt. Bitte klicken Sie hier für eine größere Version dieser Figur.
Menschlichen | ||||||||
Name | Sequenz | Chromosom | Strang | Start GRCh38/hg38 | Ende GRCh38/hg38 | Primer-Kombinationen, 3 C Interaktionen und Biotin-Aufnahme zu testen | ||
HS AHF64 Dekker | GCATGCATTAGCCTCTGCTGTTCTCTGAAATC | 11 | + | 116803960 | 116803991 | Verwenden Sie in Kombination mit hs AHF66 Dekker | ||
HS AHF66 Dekker | CTGTCCAAGTACATTCCTGTTCACAAACCC | 11 | + | 116810219 | 116810248 | Verwenden Sie in Kombination mit hs AHF64 Dekker | ||
HS-MYC-locus | GGAGAACCGGTAATGGCAAA | 8 | - | 127733814 | 127733833 | Verwenden Sie in Kombination mit hs MYC +1820 oder hs MYC-538 | ||
HS MYC +1820 | AAAATGCCCATTTCCTTCTCC | 8 | + | 129554527 | 129554547 | Verwenden Sie in Kombination mit hs MYC locus | ||
HS MYC-538 | TGCCTGATGGATAGTGCTTTC | 8 | - | 127195696 | 127195716 | Verwenden Sie in Kombination mit hs MYC locus | ||
HS HIST1 F | AAGCAGGAAAAGGCATAGCA | 6 | + | 26207174 | 26207193 | Verwenden Sie in Kombination mit hs HIST1 R | ||
HS HIST1 R | TCTTGGGTTGTGGGACTTTC | 6 | + | 27771575 | 27771594 | Verwenden Sie in Kombination mit hs HIST1 F | ||
Maus | ||||||||
Sequenz | Chromosom | Strang | Start GRCm38/mm10 | Ende GRCm38/mm10 | Primer-Kombinationen, 3 C Interaktionen und Biotin-Aufnahme zu testen | |||
TCATGAGTTCCCCACATCTTTG | 8 | + | 84841090 | 84841111 | Verwenden Sie in Kombination mit mm Calr2 | |||
CTGTGGGCACCAGATGTGTAAAT | 8 | + | 84848519 | 84848541 | Verwenden Sie in Kombination mit mm Calr1 | |||
TATCAAGGGTGCCCGTCACCTTCAGC | 6 | + | 125163098 | 125163123 | Verwenden Sie in Kombination mit Gapdh4 Dekker | |||
GGGCTTTTATAGCACGGTTATAAAGT | 6 | + | 125163774 | 125163799 | Verwenden Sie in Kombination mit Gapdh3 Dekker | |||
GGAGGAGGGAAAAGGAGTGATT | 6 | + | 52212829 | 52212850 | Verwenden Sie in Kombination mit mm Hoxa13 | |||
CAGGCATTATTTGCTGAGAACG | 6 | - | 52253490 | 52253511 | Verwenden Sie in Kombination mit mm Hoxa7 | |||
GGGTAATGGTGTCACTAACTGG | 13 | + | 23571284 | 23571305 | Verwenden Sie in Kombination mit Hist1h3e oder mm Hist1h4i | |||
GGGTTTGATGAGTTGGTGAAG | 13 | + | 23566541 | 23566561 | Verwenden Sie in Kombination mit mm Hist1h2ae | |||
TTGGGCCAAAGCCTATATGA | 13 | + | 22043085 | 22043104 | Verwenden Sie in Kombination mit mm Hist1h2ae |
Tabelle 1: Primer-Sequenzen für die Qualitätskontrolle von Mensch und Maus Hi-C-Bibliotheken.
Modularer Aufbau der Promoter erfassen Hi-C
Promotor erfassen Hi-C dient zur speziell Hi-C-Bibliotheken für Interaktionen mit Promotoren bereichern. Diese Interaktionen umfassen nur eine Teilmenge der Ligatur Produkte in Hi-C-Bibliothek.
Capture Hi-C kann leicht geändert werden, um Hi-C-Bibliotheken für genomische Region oder Regionen von Interesse zu bereichern, indem Sie ändern die Capture-System. Capture Regionen können kontinuierliche genomic Segmente44,45,46,48, Enhancer, die wurden identifiziert in PCHi-C ('Reverse erfassen Hi-C'35) oder DNase ich überempfindlich Websites49 . Die Größe des Capture-System ist abhängig von den experimentellen Bereich einstellbar. Z. B. Dryden Et Al. Zielen Sie auf 519 Köder Fragmente in drei gen-Wüsten Brust Krebs44zugeordnet. Die Capture-System von Martin Et Al. richtet sich an beide kontinuierliche genomic Segmente ("Capture Region": 211 genomische Regionen insgesamt; 2.131 Einschränkung Fragmente) und Promotoren (3.857 Gen Promotoren)45ausgewählt.
SureSelect Bibliotheken sind in verschiedenen Größen erhältlich: 1 kb bis 499 kb (5.190 – 4.806), 500 kb bis 2,9 Mb (5.190 – 4.816) und 3 Mb bis 5,9 Mb (5.190 – 4.831). Da jede einzelne Aufnahme Biotin-RNA 120 Nukleotide lang ist, diese Systeme zu erfassen maximal 4.158 beherbergen, 24.166 und 49.166 einzelnen Sonden, bzw. zu erfassen. Dies entspricht bzw. 2.079, 12.083 und 24.583 gezielte Einschränkung Fragmente (Beachten Sie, dass die Zahlen für Einschränkung Fragmente Untergrenzen basiert auf der Annahme, dass zwei einzelne Aufnahme Sonden für jede Beschränkung gestaltet werden können Fragment – in Wirklichkeit durch repetitive Sequenzen werden dies nicht der Fall für jede Beschränkung fragment (siehe auch Abbildung 1 b, C), was zu einer höheren Anzahl von Aktionsleisten Einschränkung Fragmente für eine Konstante Anzahl von verfügbaren Erfassung Sonden ).
Das hier beschriebene Protokoll basiert auf der Verwendung von ein Restriktionsenzym mit einer 6 bp Anerkennung Website langreichweitige Wechselwirkungen aufzudecken. Mit einem Restriktionsenzym mit einer 4 bp Anerkennung Website für höhere Auflösung mehr proximalen Interaktionen ist auch möglich40,49.
Einschränkungen der PCHi-C
Eine inhärente Einschränkung alle Chromosom Konformation Erfassung Assays ist, dass ihre Auflösung durch das Restriktionsenzym verwendet für die Bibliothek-Generation bestimmt wird. Interaktionen, die zwischen DNA-Elementen befindet sich auf der gleichen Beschränkungsfragment auftreten sind für "C-Type" Assays unsichtbar. Darüber hinaus in PCHi-C, in einigen Fällen mehr als eine Transkription Startsite befinden sich auf der gleichen Veranstalter-haltigen Beschränkungsfragment und PIRs in einigen Fällen Hafen beide aktiv und repressiven Histon-Markierungen, so dass es schwierig zu lokalisieren, die regulatorischen Elemente vermitteln die Wechselwirkungen und die regulatorischen Ausgabe des Projektträgers Interaktionen zu prognostizieren. Mit Restriktionsenzymen mit 4 bp Anerkennung Sites mildert dieses Problem aber geht zu Lasten der stark zunehmende Komplexität der Hi-C-Bibliothek (Hi-C-Bibliotheken generiert mit 4 bp Anerkennung Website Restriktionsenzyme sind mindestens 100 Mal komplexer als Hi-C Bibliotheken mit 6 bp Anerkennung Website Restriktionsenzymen generiert), und die damit verbundenen Kosten für die Sequenzierung der nächsten Generation.
Eine weitere Einschränkung ist, dass die aktuelle PCHi-C Protokoll verlangt, dass Millionen von Zellen als Ausgangsmaterial, Analyse der Projektträger Wechselwirkungen in seltene Zelltypen entgegensteht. Eine modifizierte Version des PCHi-C ermöglichen das Verhör der Veranstalter Kontakte in Zell-Populationen mit 10.000 bis 100.000 Zellen (z. B. während der frühen Embryonalentwicklung oder Blutstammzellen) wäre daher eine wertvolle Ergänzung zur Erfassung Hallo-C Toolbox.
Schließlich, wie alle Methoden, die auf Formaldehyd Fixierung verlassen, zeichnet PCHi-C nur Interaktionen, die "eingefroren werden" zum Zeitpunkt der Fixierung. So sind um die Kinetik und Dynamik der Projektträger Interaktionen zu untersuchen, Methoden wie Höchstauflösung live Zelle Mikroskopie neben PCHi-C. erforderlich
Methoden, um räumliche Chromosom Organisation mit hoher Auflösung zu sezieren
Die große Komplexität der chromosomalen Interaktion Bibliotheken verbietet die zuverlässige Identifizierung von Produkten der Interaktion zwischen zwei besonderen Beschränkung Fragmente mit statistischer Signifikanz. Um dieses Problem zu umgehen, wurde Sequenz Capture verwendet, entweder Hi-C33,34,40,44 oder 3 C-50,-51 -Bibliotheken für spezifische Wechselwirkungen zu bereichern. Der große Vorteil der Verwendung von Hi-C-Bibliotheken über 3C-Bibliotheken für die anreicherungsschritt ist, dass Hi-C, im Gegensatz zu 3C, ein anreicherungsschritt für echte Ligatur Produkte enthält. Infolgedessen ist der Prozentsatz der gültigen liest in PCHi-C-Bibliotheken etwa 10-fach höher als im Capture-C Bibliotheken50, enthielt ca. 5 – 8 % gültig nach HiCUP Filtern liest. Sahlen Et Al. haben direkt gegenüber Capture-C, HiCap, die wie PCHi-C Hi-C-Bibliotheken für Capture Bereicherung, im Gegensatz zu Capture-C nutzt die 3 C-Bibliotheken verwendet. In Übereinstimmung mit unseren Erkenntnissen, fanden sie, dass Capture-C-Bibliotheken vor allem UN aufgespaltenen Fragmente40zusammengesetzt sind. Darüber hinaus hatte HiCap Bibliotheken eine höhere Komplexität als Capture-C Bibliotheken40.
Eine Variante von Capture-C, genannt der nächsten Generation Capture-C52 (NG Capture-C) verwendet eine Oligo pro Beschränkung Fragment Ende, als vorher festgelegten PCHi-C33,34, anstelle von überlappenden Sonden verwendet im original Capture-C Protokoll50. Dadurch erhöht sich den Prozentsatz der gültigen liest im Vergleich zu Capture-C bescheiden, aber NG Capture-C beschäftigt zwei sequentielle runden Capture Bereicherung und eine relativ hohe Anzahl von PCR-Zyklen (20 bis 24 Zyklen insgesamt im Vergleich zu 11 Zyklen in der Regel für PCHi-C), die zwangsläufig führt zu höheren Zahlen der Reihenfolge Duplikate und geringere Komplexität der Bibliothek. In Studie Experimente bei der Optimierung der PCHi-C, fanden wir, dass der Anteil der einzigartigen (d. h. nicht dupliziert) Paare betrug nur rund 15 % lesen, wenn wir 19 PCR-Zyklen verwendet (13 Zyklen Pre-capture + 6 Zyklen Post-Datenerfassung; nicht dargestellt), jedoch Optimierung auf eine niedrigere Zahl von PCR-Zyklen, in der Regel ergibt 75 – 90 % einzigartige lesen Sie Paaren. So, Verringerung der Zahl der PCR-Zyklen deutlich erhöht die Menge an informativen Sequenzdaten.
Eine neue Methode verbindet ChIP mit Hi-C auf chromosomale Wechselwirkungen vermittelt durch ein bestimmtes Protein des Interesses (HiChIP53) konzentrieren. Im Vergleich zu ChIA PET54, die auf eine ähnliche Begründung beruht, enthält HiChIP Daten eine höhere Anzahl von informativen Sequenz liest, damit mehr Zuversicht Interaktion aufrufen53. Es wird sehr interessant sein, die entsprechenden HiChIP direkt zu vergleichen und Datensätze erfassen Hi-C einmal sie verfügbar (z. B. HiChIP mit einem Antikörper gegen die Cohesin Einheit Smc1a53 mit Capture Hi-C für alle Smc1a Beschränkung gebunden werden (Fragmente) nebeneinander. Eine inhärente Unterschied zwischen diesen beiden Ansätzen ist, dass Capture Hi-C nicht auf Chromatin Immunopräzipitation setzt, und daher in der Lage ist, Verhören chromosomale Interaktionen unabhängig von Protein-Belegung. Dies ermöglicht Vergleich von 3D Genom-Organisation in dem Vorhandensein oder Fehlen von bestimmten Faktor Bindung, wie verwendet wurde, um PRC1 als schlüsselregulator der Maus ESC räumliche Genom Architektur7identifizieren.
PCHi-C und GWAS
Genomweite Assoziationsstudien (GWAS) haben ergeben, dass mehr als 95 % der krankheitsassoziierten Sequenzvarianten befinden sich in nicht-kodierenden Regionen des Genoms, oft bei großen Entfernungen zu Protein-kodierenden Gene55. GWAS-Varianten sind oft fand in unmittelbarer Nähe zum DNase ich überempfindlich Websites, das ist ein Markenzeichen von Sequenzen mit potenziellen Regulierungstätigkeit. PCHi-C- und Hi-C erfassen intensiv genutzt, Promotoren GWAS Risiko Loci in Brust Krebs44, Darmkrebs48und Autoimmunerkrankung35,45,46verwickelt zu verknüpfen. Ein PCHi-C Studie über 17 verschiedene menschliche blutbildenden Zelle Arten fand SNPs zugeordnete Autoimmunerkrankung in PIRs in lymphoiden Zellen angereichert wurden während Sequenzvarianten, die Blutplättchen und roten Blutkörperchen bestimmte Merkmale zugeordnet überwiegend in gefunden wurden die Makrophagen und Erythroblasts, bzw.35,56. So Gewebetyp spezifischen Promotor Interactomes aufgedeckt durch PCHi-C kann helfen, um zu verstehen, die Funktion der nicht-kodierenden krankheitsassoziierten Varianten-Sequenz und identifizieren neue mögliche Krankheitsgene für eine therapeutische Intervention.
Merkmale der Promotor-Interaktion Regionen
Einige Linien des Beweises Promotor Interactomes mit Gen-Expressions verknüpfen. Zunächst mehrere PCHi-C-Studien haben gezeigt, dass genomische Regionen Interaktion mit Promotoren (hoch) ausgedrückten Gene in Zusammenhang mit Enhancer Aktivität, z. B. H3K27 Acetylierung und p300 Bindung33,34 Mark angereichert sind , 37. fanden wir eine positive Korrelation zwischen Gen-Ausdruck-Ebene und die Anzahl der interagierenden Enhancer, was darauf hindeutet, dass additive Effekte der Geschmacksverstärker führen zu erhöhte Genexpression Ebenen34,35. Zweitens: natürlich vorkommende Ausdruck, die quantitative Trait Loci (eQTLs) in PIRs angereichert sind, die die gleichen Gene verbunden sind, deren Ausdruck die eQTLs35betroffen ist. Drittens fand durch die Integration von Reise-57 und PCHi-C Daten, Cairns Et Al. , dass Reise-Reporter-Gene zuordnen PIRs in Maus WSR stärker Reporter Genexpression als Reporter-Gene bei Integration Websites in nicht-Promotor-wechselwirkenden Regionen zeigen 58, darauf hinweist, dass PIRs transkriptionelle Regulierungstätigkeit besitzen. Zusammen, zufolge diese Feststellungen Promotor Interactomes aufgedeckt durch PCHi-C in verschiedenen Maus und menschlichen Zelltypen wichtige regulatorische Module für gen-Expressions beinhalten.
Es ist erwähnenswert, dass Enhancer repräsentieren nur einen kleinen Bruchteil (~ 20 %) von allen PIRs von PCHi-C33,34aufgedeckt. Anderen PIRs konnten strukturelle oder topologische Rollen, anstatt direkte transkriptionelle regulatorische Funktionen. Allerdings gibt es auch Hinweise darauf, dass PCHi-C DNA-Elemente mit regulatorischer Funktion entdecken kann, die nicht klassischen Enhancer Marken Hafen zu tun. In einer menschlichen lymphatischen Zelllinie wurde der BRD7 Veranstalter gefunden, mit einer Region frei von Enhancer Marken interagieren, die gezeigt wurde, um Enhancer Aktivität im Reporter-gen Assays33besitzen. Regulatorische Elemente mit ähnlichen Eigenschaften möglicherweise häufiger als derzeit angenommen. Ein CRISPR-basierten Bildschirm für regulatorische DNA-Elemente identifiziert unmarkierte regulatorische Elemente (Massnahmen), die Genexpression zu steuern, sondern sind frei von Enhancer kennzeichnet z. B.59.
In anderen Fällen wurden die PIRs Chromatin Marken zugeordnet transkriptionellen Repression Hafen gezeigt. PIRs und interagierenden Promotoren durch PRC1 in Maus WSR gebunden waren in ein räumlich ausgedehntes verdrängten Gene tragen engagiert die repressiven H3K27me37markieren. In menschlichen Lymphoblastoid Zellen unterdrückt eine entfernte Element interagiert mit dem BCL6 -Promotor Transgen Reporter-Gen Ausdruck33, was darauf hindeutet, dass es funktionieren kann, um BCL6 Transkription in ihrem systemeigenen Kontext zu unterdrücken.
PIRs angereichert für Belegung des Chromatin-Isolator-Proteins CTCF in menschlichen WSR und NEC37 noch eine weitere Klasse von PIRs darstellen kann. Diesen Ergebnissen zufolge gemeinsam PIRs beherbergen eine Sammlung von regulatorischen Genaktivitäten noch zu funktional charakterisiert werden.
Autoren haben nichts preisgeben.
Wir danken Valeriya Malysheva für kritische Lektüre des Manuskripts und Hilfe von Experten mit Abbildung 1. Diese Arbeit wurde vom Medical Research Council, UK (MR/L007150/1) und die UK Biotechnologie und biologische Wissenschaften Research Council, UK (BB/J004480/1) unterstützt.
Name | Company | Catalog Number | Comments |
16% (vol/vol) paraformaldehyde solution | Agar Scientific | R1026 | |
Dulbecco's Modified Eagle Medium (DMEM) 1x | Life Technologies | 41965-039 | |
Fetal bovine serum (FBS) sterile filtered | Sigma | F9665 | |
Low-retention filter tips | Starlab | S1180-3810, S1180-1810, S1180-8810 and S1182-1830 | |
10x PBS pH 7.4 | Life Technologies | 70011-036 | |
Molecular biology grade water | Sigma-Aldrich | W4502 | |
1 M Tris-HCl pH 8.0 | Life Technologies | 15568-025 | |
IGEPAL CA-630 | Sigma-Aldrich | I8896 | |
5 M NaCl | Life Technologies | 24740-011 | |
Protease inhibitor cocktail (EDTA-free) | Roche Diagnostics | 11873580001 | |
Restriction buffer 2 (10x NEBuffer 2) | New England Biolabs | B7002 | |
DNA LoBind tube, 1.5 mL | Eppendorf | 0030 108.051 | |
DNA LoBind tube, 2 mL | Eppendorf | 30108078 | |
20% (wt/vol) SDS | Bio-Rad Laboratories | 161-0418 | |
20% (vol/vol) Triton X-100 | Sigma-Aldrich | T8787 | |
HindIII, 100 U/uL | New England Biolabs | R0104 | |
10 mM dCTP | Life Technologies | 18253-013 | |
10 mM dGTP | Life Technologies | 18254-011 | |
10 mM dTTP | Life Technologies | 18255-018 | |
0.4 mM Biotin-14-dATP | Life Technologies | 19524-016 | |
DNA polymerase I large (Klenow) fragment 5000 units/mL | New England Biolabs | M0210 | |
10x T4 DNA ligase reaction buffer | New England Biolabs | B0202 | |
100x 10mg/ml Bovine Serum Albumin | New England Biolabs | B9001 | |
T4 DNA ligase, 1 U/μL | Invitrogen | 15224-025 | |
RNase A | Roche | 10109142001 | |
Proteinase K, recombinant, PCR grade | Roche | 3115836001 | |
20 000×g 50 ml centrifuge tube | VWR | 525-0156 | |
0.5 M EDTA pH 8.0 | Life Technologies | 15575-020 | |
Phenol pH 8.0 | Sigma | P4557 | |
Phenol: Chloroform: Isoamyl Alcohol 25:24:1 | Sigma | P3803 | |
Sodium acetate pH 5.2 | Sigma | S7899 | |
Quant-iT PicoGreen | Invitrogen | P7589 | |
QIAquick Gel Extraction Kit | Qiagen | 28704 | |
QIAquick PCR Purification Kit | Qiagen | 28104 | |
Restriction buffer 2.1 (10x NEBuffer 2.1) | New England Biolabs | B7202 | |
NheI, 100U/uL | New England Biolabs | R0131 | |
Micro TUBE AFA Fiber Pre-slit snap cap 6x16mm vials | Covaris | 520045 | For sonication |
SPRI beads (Agencourt AMPure XP) | Beckman Coulter | A63881 | |
Dynabeads MyOne Streptavidin C1 beads | Invitrogen | 65001 | |
Tween 20 | Sigma | P9416 | |
10 mM dATP | Life Technologies | 18252-015 | |
T4 DNA polymerase 3000 units/mL | New England Biolabs | M0203 | |
T4 PNK 10000 units/mL | New England Biolabs | M0201 | |
Klenow exo minus 5000 units/mL | New England Biolabs | M0212 | |
Quick ligation reaction buffer | New England Biolabs | B6058 | |
NEB DNA Quick ligase | New England Biolabs | M2200 | |
PE adapter 1.0 (5'-P-GATCGGAAGAGCGGTTCAGC AGGAATGCCGAG-3') | Illumina | ||
PE adapter 2.0 (5'-ACACTCTTTCCCTACACGACGCT CTTCCGATCT-3') | Illumina | ||
NEB Phusion PCR kit | New England Biolabs | M0530 | |
PE PCR primer 1.0 (5'-AATGATACGGCGACCACCGA GATCTACACTCTTTCCCTAC ACGACGCTCTTCCGATCT-3') | Illumina | ||
PE PCR primer 2.0 (5'-CAAGCAGAAGACGGCATACGA GATCGGTCTCGGCATTCCT GCTGAACCGCTCTTCCGATCT-3') | Illumina | ||
PCR strips | Agilent Technologies | 410022 and 401425 | |
SureSelect SSEL TE Reagent ILM PE full adaptor kit | Agilent Technologies | 931108 | |
SureSelect custom 3-5.9 Mb library | Agilent Technologies | 5190-4831 | custom design mouse or human PCHi-C system |
Dynabeads MyOne Streptavidin T1 beads | Invitrogen | 65601 | |
E220 high-performance focused ultra-sonicator | Corvaris | E220 |
Genehmigung beantragen, um den Text oder die Abbildungen dieses JoVE-Artikels zu verwenden
Genehmigung beantragenThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Alle Rechte vorbehalten