Method Article
* Ces auteurs ont contribué à parts égales
La méthode Salut-C permet l'identification sans parti pris, l'ensemble du génome des interactions chromatine (1). Salut-C couples ligature de proximité et le séquençage massivement parallèle. Les données obtenues peuvent être utilisées pour étudier l'architecture génomique à plusieurs échelles: premiers résultats identifié des caractéristiques telles que les territoires chromosomiques, la ségrégation de la chromatine ouverte et fermée, et la structure de la chromatine à l'échelle mégabase.
Le pliage en trois dimensions des chromosomes du génome et compartimente et peut apporter éloignés des éléments fonctionnels, tels que les promoteurs et activateurs, dans la proximité spatiale proches 2-6. Décrypter la relation entre l'organisation des chromosomes du génome et de l'activité contribuera à la compréhension des processus génomique, comme la transcription et la réplication. Cependant, on sait peu sur la façon dont les chromosomes se coucher. La microscopie est incapable de distinguer un grand nombre de loci simultanément ou à haute résolution. À ce jour, la détection des interactions chromosomiques en utilisant la capture de conformation des chromosomes (3C) et ses adaptations ultérieures nécessaires au choix d'un ensemble de loci cibles, ce qui rend l'ensemble du génome d'études 7-10 impossible.
Nous avons développé Salut-C, une extension de 3C qui est capable d'identifier les interactions à longue portée dans un parti pris, l'échelle du génome de la mode. Dans Salut-C, les cellules sont fixées avec du formaldéhyde, causant des loci interagissent à être liés les uns aux autres par le biais de liaisons covalentes ADN-protéines des liens croisés. Lorsque l'ADN est ensuite fragmenté avec une enzyme de restriction, ces loci restent liés. Un résidu biotinylé est incorporé comme la 5 'surplombs sont remplis po Ensuite, ligature des extrémités franches est effectuée dans des conditions qui favorisent des événements diluer la ligature entre les fragments d'ADN réticulé. Il en résulte une bibliothèque de l'échelle du génome des produits de ligation, correspondant à des paires de fragments qui étaient à l'origine à proximité les uns aux autres dans le noyau. Chaque produit de ligation est marqué avec la biotine sur le site de la jonction. La bibliothèque est cisaillé, et les jonctions sont tirés vers le bas avec des billes de streptavidine. Les jonctions purifiés peuvent ensuite être analysées à l'aide d'un séquenceur à haut débit, résultant en un catalogue de fragments d'interagir.
Analyse directe de la matrice de contact qui en résulte révèle de nombreuses caractéristiques de l'organisation génomique, tels que la présence de territoires chromosomiques et l'association préférentielle des petits riches en gènes des chromosomes. L'analyse de corrélation peut être appliquée à la matrice de contact, ce qui démontre que le génome humain est séparé en deux compartiments: un compartiment moins dense contenant chromatine ouverte, accessible et active et un compartiment plus dense contenant fermé, inaccessible, et inactive les régions de chromatine. Enfin, l'analyse d'ensemble de la matrice de contact, couplé avec des calculs théoriques et des simulations informatiques, a révélé que, à l'échelle mégabase Salut-C révèle des caractéristiques compatibles avec une conformation globule fractale.
Cette méthode a été utilisée dans la recherche présentée dans Lieberman-Aiden et al., Science 326, 289-293 (2009) .
Réticulation I., Digestion, Marquage des extrémités d'ADN, et ligature des extrémités franches
II. Shearing et Sélection de la taille
III. Biotine déroulant et appariés fin Séquencement
IV. Représentant Salut-C Résultats
Figure 1. Salut-C aperçu. Les cellules sont réticulés avec du formaldéhyde, ce qui entraîne des liaisons covalentes entre les segments de la chromatine spatialement adjacents (fragments d'ADN: bleu foncé, rouge, les protéines, ce qui peut servir de médiateur de telles interactions, sont représentées en bleu clair et cyan). La chromatine est digéré par une enzyme de restriction (ici, HindIII; site de restriction: ligne pointillée, voir encadré). Les extrémités résultant collants sont remplis avec des nucléotides, dont l'un est biotinylé (point violet). La ligature est effectuée dans des conditions extrêmement diluées conditions favorisant des événements ligature intramoléculaire; le site HindIII est perdu et un site Nhel est créé (en médaillon). L'ADN est purifié et cisaillé, et les jonctions biotinylé sont isolées en utilisant des billes de streptavidine. Interagir fragments sont identifiés par séquençage jumelé-end.
Figure 2. Salut-C contrôle la qualité de la bibliothèque. (A) Des quantités croissantes d'un contrôle et une bibliothèque 3C Salut-C ont été résolus sur un gel agarose à 0,8%. Les deux bibliothèques d'exécution en tant que groupe assez serré de plus de 10 ko. L'efficacité ligature typique dans une bibliothèque de Salut-C est légèrement inférieure à ce qui est observé dans un modèle 3C, et est indiqué par le frottis dans les ruelles Salut-C. (B) PCR digérer contrôle. Une jonction ligature formée par deux fragments voisins est amplifié en utilisant la norme 3C conditions de PCR. Produits de ligation Salut-C peuvent être distingués de ceux produits dans conventionnelle 3C de la digestion des site de ligature. Salut-C jonctions sont coupés par Nhel, pas HindIII; l'inverse est vrai pour les jonctions 3C. 70% de Salut-C amplicons ont été coupées par Nhel, confirmant l'efficacité marquant de jonction ligature. Deux répétitions ont été effectuées afin d'assurer une quantification fiable.
Figure 3. Salut-C lire des contrôles de qualité. (A) se lit à partir de fragments correspondant à la fois intrachromosomique (bleu) et interchromosomique (rouge) d'aligner les interactions beaucoup plus proche de sites de restriction HindIII par rapport à lit générés aléatoirement (en vert). Tant le intrachromosomique lit et lit interchromosomique courbes décroissent rapidement la distance entre le site HindIII augmente jusqu'à un plateau est atteint à une distance de ~ 500 pb. Cela correspond à la taille du fragment maximum utilisé pour le séquençage. (B) En règle générale, 55% des paires alignable lire représenter les interactions interchromosomique. Quinze pour cent représentent les interactions entre les fragments intrachromosomique moins de 20 kopart et 30% sont intrachromosomique paires lu que plus de 20 ko à part. Cette distribution peut être échantillonné avant séquençage à haut débit, comme une forme de contrôle de qualité; clonage et de séquençage Sanger d'environ 100 clones est généralement suffisant.
Figure 4. L'analyse de corrélation montre que le noyau est séparé en deux compartiments. (A) correspondant à des interactions Heatmap intrachromosomique sur le chromosome 14. Chaque pixel représente toutes les interactions entre un lieu de 1 Mo et d'un autre locus 1-Mo; intensité correspond au nombre total de lectures (gamme: 0-200 lectures). Les graduations apparaissent tous les 10 Mb. La sous-structure heatmap expositions sous la forme d'une diagonale intense et une constellation de grands blocs. (Chromosome 14 est acrocentriques;. Le bras court n'est pas représenté) Utilisation de l'ensemble de données Salut-C pour calculer la probabilité de contact moyenne pour une paire de loci génomiques à une distance donnée, une matrice d'attente est produite (B) correspondant à ce qui serait observée s'il n'y avait pas de structures à longue portée. Le quotient de ces deux matrices est une matrice observé / attendu (C) où l'épuisement est représentée en bleu et l'enrichissement en rouge [plage: 0,2 (bleu) à 5 (rouge)]. Le schéma bloc devient plus évidente. La corrélation (D) illustre la corrélation matricielle [plage: -1 (bleu) à 1 (rouge)] entre les profils d'interaction intrachromosomique de chaque paire de loci long du chromosome 14. Le modèle de plaid frappante indique la présence de deux compartiments dans le chromosome.
Figure 5. La présence et l'organisation des territoires chromosomiques. (A) Probabilité de contact diminue en fonction de la distance génomique sur le chromosome 1, pour finalement atteindre un plateau à ~ 90MB (bleu). Le niveau de contact interchromosomique (tirets noirs) diffère pour les différentes paires de chromosomes; loci sur le chromosome 1 sont les plus susceptibles d'interagir avec des loci sur le chromosome 10 (tirets verts) et les moins susceptibles d'interagir avec des loci sur le chromosome 21 (tirets rouges). Interactions interchromosomique sont épuisés par rapport aux interactions intrachromosomique. (B) observé / attendu nombre de contacts interchromosomique entre toutes les paires de chromosomes. Le rouge indique l'enrichissement et bleue indique l'épuisement [plage: 0,5 (bleu) à 2 (rouge)]. Petit, riches en gènes des chromosomes ont tendance à interagir davantage avec l'autre.
Figure 6. L'emballage locale de la chromatine est cohérente avec le comportement d'un globule fractale. (A) la probabilité de contact en fonction de la distance génomique, en moyenne sur tout le génome (en bleu). Une mise à l'échelle de puissance de premier plan loi est observée entre 500kb et 7Mo (ombrée) avec une pente de -1,08 (ajustement montré en cyan). (B) Les résultats de simulation de la probabilité de contact en fonction de la distance d'équilibre (rouge) et fractale (en bleu) des globules. La pente d'un globule fractale est très près -1 (cyan), confirmant ainsi notre prévision roman théorique 1. La pente d'un globule équilibre est -3 / 2, ce qui correspond aux attentes théorique préalable. La pente pour le globule fractale ressemble étroitement à la pente observée dans les résultats Salut-C, alors que la pente pour un globule équilibre n'est pas vu dans les données de Salut-C. (C) En haut: Une chaîne de polymère déplié, 4000 monomères de long. Coloration correspond à la distance d'une extrémité, allant du bleu au cyan, vert, jaune, orange et rouge-Orient:. Exemple typique d'un globule fractale tirées de notre ensemble. Globules Fractal manque enchevêtrements. Loci qui sont à proximité le long du contour ont tendance à être proches en 3D, ce qui conduit à la présence de grands blocs monochromes qui sont apparentes à la surface et en coupe du bas:. Un globule de l'équilibre. La structure est très enchevêtré; loci qui sont à proximité le long du contour (couleur similaire) ne doivent pas être à proximité en 3D.
Nous présentons une méthode d'étude de l'architecture 3-dimensions du génome par la cartographie des interactions chromatine dans un parti pris, l'échelle du génome manière. L'étape la plus critique expérimentale ce qui distingue cette technologie en dehors du travail précédent - est l'incorporation de nucléotides biotinylés à la restriction extrémités des fragments réticulé avant ligature des extrémités franches. L'exécution de cette étape permet succès profonde séquençage de tous les carrefours ligature, et donne Salut-C sa portée et sa puissance.
Le nombre de lectures détermineront finalement la résolution des cartes d'interaction. Ici, une carte 1 Mo d'interaction pour le génome humain est présentée en utilisant ~ 30 millions de lectures alignable. Afin d'augmenter la résolution «tout usage» par un facteur de n, le nombre de lectures doit être augmenté par un facteur de N 2.
La technique de Salut-C peuvent être facilement combinés avec d'autres techniques, telles que la capture hybride après la génération de la bibliothèque (pour cibler des parties spécifiques du génome) et immunoprécipitation de la chromatine après ligature (pour étudier l'environnement des régions de la chromatine associée à des protéines spécifiques).
Nous remercions A. Kosmrlj pour les discussions et le code; AP Aiden, XR Bao, M. Brenner, D. Galas, W. Gosper, A. Jaffer, A. Melnikov, A. Miele, G. Giannoukos, C. Nusbaum, AJM Walhout , L. Wood, et K. Zeldovich pour les discussions, et L. Gaffney et B. Wong pour aider à la visualisation.
Soutenu par une Fannie et John Hertz Fondation bourse d'études supérieures, une défense nationale des sciences et de génie bourse d'études supérieures, une bourse d'études supérieures NSF, la National Space Biomedical Research Institute, et d'accorder aucune. T32 HG002295 du National Human Genome Research Institute (NHGRI) (EL); i2b2 (Informatique pour l'intégration de la biologie et la recherche clinique), le NIH soutenus Centre de Calcul Biomédical au Brigham and Women s Hospital (LAM); accorder aucune. HG003143 du NHGRI, et un Prix d'excellence de la Fondation Keck jeune érudit (JD). Raw et cartographié les données de séquence Salut-C a été déposé à la base de données GEO ( www.ncbi.nlm.nih.gov/geo/ ), accession no. GSE18199. Visualisations supplémentaires sont disponibles à http://hic.umassmed.edu .
Name | Company | Catalog Number | Comments |
Protease inhibitors | Sigma-Aldrich | P8340-5ml | Step 1.2 |
biotin-14-dCTP | Invitrogen | 19518-018 | Step 1.6 |
Klenow | New England Biolabs | M0210 | Steps 1.6 and 2.2 |
T4 DNA ligase | Invitrogen | 15224 | Step 1.9 |
T4 DNA polymerase | New England Biolabs | M0203 | Steps 1.17 and 2.2 |
10x ligation buffer | New England Biolabs | B0202 | Steps 2.2 and 3.4 |
T4 PNK | New England Biolabs | M0201 | Step 2.2 |
Klenow (exo-) | New England Biolabs | M0212 | Step 2.3 |
Dynabeads MyOne Streptavin C1 Beads | Invitrogen | 650.01 | Step 3.2 |
T4 DNA ligase HC | Enzymatics | L603-HC-L | Step 3.5 |
Phusion HF mastermix | New England Biolabs | F531 | Step 3.8 |
Ampure beads | Beckman Coulter Inc. | A2915 | Step 3.9 |
Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE
Demande d’autorisationThis article has been published
Video Coming Soon