Method Article
Nous décrivons ici le protocole et la mise en œuvre du méthyl-Seq, une plate-forme épigénomique, utilisant un modèle de rat pour identifier les changements épigénétiques liés à l’exposition de stress chronique. Les résultats démontrent que la plate-forme de méthyl-Seq de rat est capable de détecter des différences de méthylation que résultent d’une exposition de stress chez les rats.
Que les génomes d’une plus grande variété d’animaux seront disponibles, il y a un besoin croissant d’outils qui permet de capturer les changements épigénétiques dynamiques dans ces modèles animaux. Le rat est un animal modèle particulier où un outil épigénétique peut compléter les nombreuses études pharmacologiques et comportementales pour fournir des informations perspicaces mécanistes. À cette fin, nous avons adapté le système de Capture SureSelect cible (dénommé méthyl-Seq) chez le rat, qui peut évaluer le taux de méthylation d’ADN au sein du génome du rat. La conception de rat ciblés promoteurs, îles de CpG, rives de l’île et les régions riches en GC de tous les gènes RefSeq.
Pour appliquer le programme sur une expérience de rat, rats Sprague Dawley mâles ont été exposés à un stress chronique variable pendant 3 semaines, après quoi les échantillons de sang ont été prélevés pour l’extraction d’ADN génomique. Méthyl-Seq bibliothèques ont été construits des échantillons d’ADN de rat par cisaillement, ligation de l’adaptateur, enrichissement de la cible, conversion de bisulfite et multiplexage. Bibliothèques ont été séquencés sur une plate-forme de séquençage de prochaine génération et les lectures séquencés ont été analysées afin d’identifier les DMR entre les ADN des rats stressés et non stressés. Meilleur candidat DMR ont été validés indépendamment par pyrosequencing bisulfite pour confirmer la robustesse de la plate-forme.
Les résultats démontrent que la plate-forme de méthyl-Seq de rat est un outil utile et épigénétique qui permet de capturer les changements de méthylation induites par l’exposition au stress.
Avancées du séquençage haut-débit ont conduit à une profusion de séquences génomiques pour modèle et organismes non-modèles. La disponibilité de telles séquences a facilité les recherches en génétique, génomique comparative et transcriptomique. Par exemple, les séquences génomiques disponibles sont très utiles pour aligner les données de séquençage de ChIP-Seq expériences qui enrichissent l’ADN issu de sa liaison avec l’histone modifications1ou séquençage de bisulfite, qui mesure la méthylation de l’ADN par détecter l’uracile formé de conversion de bisulfite de cytosines non méthylé2. Toutefois, on a des retards dans la mise en œuvre de plates-formes épigénomique qui incorporent des données de séquençage génomique disponible dans leur conception en raison d’un manque de données annotées des séquences régulatrices spécifiques qui peuvent influencer la fonction du gène.
En particulier, méthylation de l’ADN est l’un des plus largement étudiées modifications épigénétiques sur l’ADN qui peuvent tirer parti des données génomiques disponibles pour la construction d’une plate-forme de méthylomiques. Un tel exemple est une plateforme basée sur la baie pour l’humain méthylome3, qui a été largement utilisé dans les différentes disciplines de l’oncologie de psychiatrie4,5. Malheureusement, les plates-formes similaires pour des modèles animaux non-humains sont rares, qu’il n’y a pratiquement aucune plateforme largement utilisé qui ont profité de la séquence génomique dans leur conception initiale.
Une méthode commune pour évaluer le paysage méthylomiques de modèles animaux non-humains est bisulfite de représentation réduite séquençage (Orr)6. Cette approche permet de surmonter le coût du séquençage du génome entier bisulfite qui, tout en offrant un paysage complet méthylomiques, offre une couverture de lecture-profondeur inférieure en raison de coût et des informations fonctionnelles limitées dans de vastes zones pauvres en gène du génome2 . Obligations à rendement réel implique Sommaire de restriction et de sélection de taille de l’ADN génomique d’enrichir à fortement les séquences riches en GC comme les îles de CpG qui sont communément trouvés près de promoteurs de gènes et joueraient un rôle dans le règlement de gène7. Alors que la méthode Orr a été utilisée dans un certain nombre d’études importantes, sa dépendance sur les enzymes de restriction n’est pas sans limites et défis remarquables. Par exemple, enrichissement des séquences riches en GC dans Orr est entièrement dépendante de la présence de séquences spécifiques reconnus par les enzymes de restriction et sélection taille ultérieure par électrophorèse. Cela signifie que n’importe quel régions génomiques qui ne contiennent pas ces sites de restriction sont exclues lors de la sélection de la taille. En outre, hétérospécifique comparaisons sont difficiles à moins que les mêmes sites de restriction sont présents dans les mêmes locus parmi les différentes espèces.
Une des façons de surmonter les limitations de ces obligations sont d’utiliser une méthode d’enrichissement qui tire profit de la séquence génomique publiée dans la conception de la plate-forme. La plate-forme humaine basée sur la baie utilise des sondes d’apprêt conçus contre GPC spécifique d’allèle spécifique (CG vs TG après conversion du bisulfite) cible recuit et amorce l’extension. Sa conception reflète non seulement la séquence génomique humaine disponible, mais des régions régulatrices vérifiée expérimentalement acquises de multiples champs d’enquête, comme ENCODE et ENSEMBL8. Malgré sa large utilisation dans les enquêtes de méthylomiques humaine, une plate-forme similaire n’existe pas pour les animaux de modèle. En outre, le format tableau met une contrainte importante sur la surface disponible pour positionner la sonde. Dans les dernières années, des efforts ont été faits pour combiner la cible-spécificité offerte par capture sonde design et la fonctionnalité de haut débit de nouvelle génération séquençage. Une telle entreprise a entraîné le système enrichissement cible basée sur le séquençage du génome de la souris (souris méthyl-Seq), qui servait à identifier les différences de cerveau-spécifique ou induite par les glucocorticoïdes de méthylation9,10. Plates-formes similaires pour d’autres modèle et non-modèle animaux sont nécessaires pour faciliter la recherche épigénomique chez ces animaux.
Ici, nous démontrons la mise en œuvre de cette plateforme novatrice pour analyser les méthylomiques sur le rat. Le rat a servi comme modèle animal important en pharmacologie, le métabolisme, neuroendocrinologie et comportement. Par exemple, il y a un besoin croissant de comprendre les mécanismes sous-jacents qui donnent lieu à la toxicité des médicaments, l’obésité, réponse au stress ou la toxicomanie. Une plate-forme haut débit capable de capturer les changements de méthylomiques liés à ces conditions augmenterait notre compréhension des mécanismes. Le génome du rat est toujours sans annotation pour les régions régulatrices, nous constituée de promoteurs non redondant, îles de CpG, île rives11et précédemment identifié les séquences riches en GC dans le rat méthyl-Seq plate-forme12.
Afin d’évaluer la conception et mise en oeuvre de la plate-forme SureSelect cible enrichissement (génériquement appelés méthyl-Seq) pour le génome du rat, nous avons utilisé un modèle de rat de stress chronique de variables (CV)13 à identifier différentiellement méthylés régions entre animaux non accentués et stressés. Notre conception de la plate-forme, protocole et mise en œuvre peuvent être utiles pour les chercheurs qui veulent mener une enquête complète et impartiale d’épigénétique sur un organisme dont la séquence génomique est déjà disponible, mais reste mal annoté.
Toutes les expériences ont été achevées en conformité et le respect de toutes les directives réglementaires et institutionnelles pertinentes, y compris le Comité de l’urbanisme à la Johns Hopkins School of Medicine et d’institutionnels animalier.
1. les animaux
2. chronique effort Variable
3. système endocriniens dosages
4. comportement
5. conception de la Rat méthyl-Seq
6. construction de la bibliothèque de méthyl-Seq de Rat de l’ADN génomique
Remarque : Pour éliminer les effets du traitement par lots, traiter des échantillons multiples en même temps et intensifier les mélanges maîtres en conséquence. Extraire l’ADN à l’aide d’un kit d’extraction d’ADN disponible dans le commerce. Colonne ou précipitation-méthodes basées sur les deux donnent l’ADN génomique de haute qualité (260/280 ratio ~ 1,8). Utilisation des méthodes axées sur le phénol ne sont pas recommandés. Éluer ou remettre en suspension l’ADN dans un tampon faible TE (10 mM TE, 0,1 mM EDTA, pH 8,0).
7. séquençage sur un séquenceur de prochaine génération
8. analyses pour déceler des DMR
9. validation par Bisulfite Pyrosequencing
Une mise en œuvre de la plate-forme de méthyl-Seq rat dépend de plusieurs critères. Figure 1 illustre le flux de travail global de l’étude et met en lumière les mesures spécifiques contrôle qualité (CQ) qui sont nécessaires avant d’avancer. Parmi les premiers facteurs à considérer est la robustesse du modèle animal et le traitement du stress, qui déterminent l’ampleur des changements épigénétiques qui se produisent à travers le méthylome. Étant donné que notre travail animale repose sur notre observation précédente exposition de corticostérone (CORT) pouvant mener à des changements dans la méthylation de l’ADN19,20, notre régime de stress chronique de variable (CVS) devait être de rigueur suffisante pour produire a souligné rats plasmatiques élevés de CORT. Un schéma typique de CVS hebdomadaire est indiqué dans le tableau 1 et se composait des facteurs de stress quotidiens dans le matin, après-midi, et durant la nuit, qui sont constamment modifiés pour empêcher l’accoutumance et diminué la réponse au stress. Dans le traitement de 3 semaines, les animaux stressés présentaient des taux significativement élevés de plasmatique moyenne CORT [jours 4 à 21, contrôlent : 32,7 3,7 ng/mL, Stress : 103,0 11,9 ng/mL (moyenne SEM), P = 2,2 x 10-4, Figure 2 a] au-dessus de ceux d’atones, animaux témoins. Invariablement, ces animaux ont également montré une plus grande anxiété comme comportement sur l’élévation plus labyrinthe (EPM), comme en témoigne le significativement plus de temps passé dans les bras fermés de l’EMP et moins de temps dans les bras ouverts (Figure 2 b). Ces résultats démontrent que l’exposition CVS conduit à endocrines significative et des changements de comportement, qui nous conduit à examiner si ces changements ont été associés à des signatures spécifiques de méthylation de l’ADN.
Nous insistons sur plusieurs points de contrôle qui sont cruciaux pour la construction réussie de la bibliothèque de méthyl-Seq. Commençant par une quantité suffisante d’ADN est nécessaire, comme la sonication, multiples lavage/purification, enrichissement de la cible, et les étapes de conversion du bisulfite successivement réduisent la quantité d’ADN dans la bibliothèque de fini. Bien que plusieurs étapes d’amplification PCR atténuer la perte de la matrice d’ADN, un nombre de cycle PCR excessif peut introduire supérieure lit double. Pour la présente étude de rat méthyl-Seq, 2 g de sang ADNg par rat a été utilisé. Nous notons que le méthyl-Seq bibliothèques peuvent être faites avec quantité d’ADN de départ aussi bas que 500 ng. Petit matériel de départ permet aux utilisateurs de générer des bibliothèques de l’ADN isolé de FACS (fluorescence-lancée de cellules tri) ou aiguille à coups de poing, bien qu’il y a un risque accru de produire une quantité insuffisante de librairies pour le séquençage subséquent. QC est interprété par électrophorèse de 1 L de l’échantillon sur un bioanalyzer, qui fournit le poids moléculaire, la quantité et la molarité ADN. Trois étapes essentielles qui nécessitent l’utilisation de la bioanalyzer sont : 1) après l’étape de sonication pour vous assurer un cisaillement suffisante d’ADN (~ 170 bp, rouge, Figure 3) ; 2) après l’étape de ligature adaptateur indiqué par un changement dans la taille moyenne de l’ADN cisaillée (~ 200 bp, bleu, Figure 3) pour assurer leur ultérieure amplification par PCR ; et 3) après l’étape de purification finale bibliothèque afin d’assurer la quantité et la taille de la bibliothèque pour l’ordonnancement.
Les paquets R BSSeq et BSmooth en Bioconductor ont été utilisées pour analyser le bisulfite de séquençage données18. Ils comprennent des outils et des méthodes d’alignement des séquence lectures, effectuer le contrôle de la qualité, et identifiant différentiellement méthylés des régions (DMR). BSmooth logiciel appelle noeud papillon 2.016,17 comme un alignement de séquence interne pour obtenir des résumés de CpG-niveau de mesure, par l’alignement des lectures d’entrée brutes au bisulfite-converti des séquences génomiques. Les lectures alignées sont ensuite filtrés à travers des procédures de contrôle de qualité rigoureux qui cherchent à identifier le séquençage systématique et des erreurs de base d’appel qui peuvent biaiser les analyses en aval. Une série de parcelles sont générés pour aider visuellement dans ce processus de filtrage. Séquençage métriques sont également générés à l’information pertinente de document tels que le nombre de lectures alignés, % cible et par la couverture de CpG, parmi d’autres (tableau 2). Une fois que les données sont filtrées, un algorithme de lissage/normalisation est réalisé, où chaque CpG est attribuée une valeur estimative de méthylation selon QC tous les lit à partir de chaque échantillon et estimations des voisins GPC pour assurer les appels plus précise de la méthylation statut même dans les cas où la couverture de la séquence est faible. Cette valeur fournit une estimation lissée de la probabilité de méthylation sur chaque site de CpG. En comparant la moyenne des estimations lissée de la méthylation de l’échantillon entre les deux groupes de traitement et le classement des régions génomiques du plus significativement différentes au moins, une liste des DMR est générée (tableau 3).
Le haut avec que DMR entre les groupes soumis à une contrainte et non accentués se trouvait dans le promoteur du gène majeur d’histocompatibilité rat Rt1-m4, a insisté sur les animaux présentant des niveaux plus élevés de la méthylation dans l’ensemble de tous les GPC que les animaux non accentué (Figure 4 a). Pour confirmer la mise en œuvre réussie de la plate-forme de méthyl-Seq et l’analyse des données, les amorces ont été conçus contre la DMR et sanguin de méthylation de l’ADN dans l’ensemble de la cohorte d’animaux stressés et non stressés (8 séquencé par méthyl-Seq et 8 non séquencé) ont été évalués par bisulfite pyrosequencing. Les résultats démontrent une augmentation significative de la méthylation de l’ADN à travers 10 hors de la 12 GPC dosés (changement de 5.1 – 10,4 % méthylation, P < 0,037, Figure 4 b). KEGG voie analyse a été effectuée sur l’ensemble de la DMR nominalement important d’identifier les voies associées au stress. Constamment, DMR associées aux voies mis en cause les maladies liés à l’exposition de stress chronique, comme le diabète, les maladies cardiovasculaires et le cancer (tableau 4). 21 , 22 , 23 pour démontrer un lien entre les données de l’épigénétiques et le degré d’exposition au stress, niveaux de méthylation au CpG-10 on a comparé les concentrations moyennes de CORT de 3 semaines pour chaque animal. Les résultats ont montré une corrélation modeste entre les données du système endocrinien et de méthylation (R2= 0,54, P = 0,001, Figure 5).
Figure 1 : ensemble schématique "workflow" pour la plateforme de rat méthyl-Seq. Un g de l’ADN génomique extrait le sang de souligner et de rats témoins est d’abord transformé pour construire les bibliothèques de méthyl-Seq pour séquençage, analyse et identification des cibles. Un autre 100 ng d’ADN est utilisé pour une validation indépendante des cibles identifiées épigénétiques par bisulfite pyrosequencing. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.
Figure 2 : exposition à un stress chronique variable (CVS) entraîne des changements endocriniens et comportements chez les rats. (A) plusieurs prélèvements de corticostérone (CORT) démontrent la robustesse de la semaine 3 régime CVS. Des échantillons de sang ont été prélevés dans la matinée avant le régime de stress quotidien. (B) a souligné animaux passée plus de temps dans les bras fermés et moins de temps dans les bras ouverts de l’élevé plus de labyrinthe (EPM). Boîtes avec point de données pour chaque animal sont indiqués. Test T de Student a été réalisé pour une signification statistique. * P < 0,05, ** P < 0,01, et *** P < 0,001. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.
Figure 3 : dosage du rat cisaillé et adaptateur-ligaturé ADN sur un bioanalyzer. Les courbes rouges et bleues montrent la quantité et la taille de l’ADN génomique (rouge) après la tonte en un sonicateur isotherme et la ligature de l’adaptateur, respectivement. Chaque ligne représente un échantillon et le rouge et bleus courbes reflètent les deux perte d’ADN au cours des plusieurs étapes (fin-réparation, 3'-adénylation et le nettoyage de l’échantillon) et augmentent en taille de bp en raison de la ligature des adaptateurs. Forte des pics à 25 bp et bp 1500 sont des marqueurs standards qui ont été ajoutés au tampon de chargement. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.
Figure 4 : les changements épigénétiques induites par CVS sont détectés par rat méthyl-suiv. (A) analyse du rat méthyl-Seq données impliqués du promoteur du gène Rt1m4 comme une région différentiellement méthylée (DMR) entre stressés (rouge) et les rats témoins (bleu). La sortie graphique pour la Rt1m4 DMR (région ombrée rose) affiche chaque CpG (ligne grise verticale), les quatre échantillons dans chaque groupe (lignes rouges ou bleues) et les niveaux de méthylation % pour chaque animal (point rouge ou bleu). (B) douze GPC au sein de la DMR ont été validés par le bisulfite pyrosequencing. Les graphiques à barres sont représentés en moyenne de SEM, et un test de Student T-a été réalisé pour une signification statistique. * P < 0,05. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.
Figure 5 : analyse de régression linéaire ont montré une corrélation modeste entre % ADN méthylation au CpG-10 de Rt1m4 et la semaine 3 plasma CORT les concentrations moyennes de tous les deux souligné et contrôlent les animaux (N = 16). Données d’animaux stressés sont représentées par des cercles rouges. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.
Semaine | Jour 1 | Jour 2 | Jour 3 | Jour 4 | Jour 5 | Jour 6 | Jour 7 |
AM | Dispositif de retenue pour | Nager | Chambre froide | Nager | Dispositif de retenue pour | Shaker | Nager |
PM | Shaker | Inclinaison de la cage | Dispositif de retenue pour | Shaker | Chambre froide | Dispositif de retenue pour | Chambre froide |
Pendant la nuit | Restreindre les aliments | Mouiller la literie | Isolement | Lumière sur | Le surpeuplement | Lumière sur | Mouiller la literie |
Tableau 1 : Un horaire hebdomadaire typique du traitement chronique d’effort variable (CVS).
Séquençage Metrics | Stress,1 | Contrôle1 |
(n = 4) | (n = 4) | |
Jumelé fin lectures (PER) | 89,290,397 | 80,165,674 |
Fin apparié unique mappé lit (UMPER) | 39,200,255 | 35,013,406 |
Efficacité de taux/cartographie alignement (UMPER / PER) | 44 % | 44 % |
Double lit (% de UMPER) | 73 % | 65 % |
UMPER dédupliquée | 10,481,031 | 12,306,018 |
Moyenne lecture profondeur couverture (x) (ARDC) | x 6 | x 6 |
GPC (N) | 12,056,878 | 12,056,878 |
ARDC (x) des GPC | x 2 | x 2 |
GPC au moins 10 lectures (N) | 481 383 | 595 850 |
ARDC (X) des GPC au moins 10 lectures | 19 | 19 |
Sur cible GPC (chevauchement complet avec sonde les régions cibles) | 1 923 872 | 2 007 638 |
Sur la cible ARDC (x) des GPC | x 7 | 8 x |
Sur cible GPC au moins 10 lectures (N) | 428 249 | 531 419 |
Sur cible ARDC (x) des GPC au moins 10 lectures | 18 x | 18 x |
Sur la cible (p. avec 1 ou plusieurs paires de bases chevauchement avec sonde les régions cibles) (UMPER) | 8 277 715 | 9 369 523 |
% Sur la cible (de UMPER dédupliquée) | 78 % | 77 % |
Sur la cible (Total Bases mappées) Mb | 125 Mo | 128 Mo |
Couverture de profondeur sur cible lecture moyenne (x) (ARDC) | 9 x | x 10 |
1 Métriques de séquençage basé sur les moyennes dans l’ensemble de sujets dans chaque groupe |
Tableau 2 : Séquençage paramètres obtenus à partir de la plate-forme de méthyl-Seq de rat.
Chr | début | fin | gène | distance | areaStat | meanDiff | stress | contrôle | Direction |
chr20 | 1 644 246 | 1 644 390 | RT1-M4 | in_gene | 93.03 | 0,22 | 0,33 | 0,11 | gain |
chr5 | 160,361,352 | 160,361,564 | LOC690911 | in_gene | -70.75 | -0,19 | 0,72 | 0,91 | perte |
CHR3 | 61,138,281 | 61,138,330 | RGD1564319 | 265569 | 61.79 | 0,21 | 0,94 | 0,72 | gain |
CHR2 | 143,064,811 | 143,065,010 | UFM1 | 8569 | -59.48 | -0,11 | 0,13 | 0,24 | perte |
chr7 | 30,764,111 | 30,764,284 | Ntn4 | in_gene | 57.04 | 0,21 | 0,94 | 0,73 | gain |
chr17 | 12,469,112 | 12,469,218 | Idnk | 41996 | -50.91 | -0,13 | 0,74 | 0,88 | perte |
chr7 | 47,101,725 | 47,101,930 | PAWR | in_gene | -50.54 | -0,12 | 0,64 | 0,76 | perte |
chr5 | 76,111,248 | 76,111,822 | Txndc8 | 151703 | -50.38 | -0,11 | 0,85 | 0,96 | perte |
chr11 | 80,640,132 | 80,640,356 | Dgkg | in_gene | -50.07 | -0,16 | 0,73 | 0,89 | perte |
chr8 | 71,759,248 | 71,759,411 | Mir190 | 210226 | -47.84 | -0,17 | 0,58 | 0,75 | perte |
Tableau 3 : Top 10 méthylé différentiellement régions. Pour chaque DMR, la table de sortie montre de gauche à droite de la colonne de droite : localisation chromosomique (chr), coordonnées (début/fin), le nom de gène, distance de la transcription site, le statistique de la superficie différentielle entre a souligné et les témoins des groupes (areaStat), signifie méthylation différentielle (meanDiff), niveaux de méthylation moyenne sur l’ensemble de chaque DMR pour a souligné et groupes témoins (/ contrôle du stress) et la direction de méthylation changent de contrôles.
Termes de voie KEGG | Comte de gène | % | P-valeur | Benjamini |
Diabète | ||||
Diabète sucré de type II | 12 | 0,1 | 3,6 x 10-4 | 9,8 x 10-3 |
Maladies cardiovasculaires | ||||
Contraction du muscle lisse vasculaire | 18 | 0,1 | 1.6 x 10-3 | 3,6 x 10-2 |
Cardiomyopathie ventriculaire droite arythmogène (CVDA) | 13 | 0,1 | 4,0 x 10-3 | 7.1 x 10-2 |
Cardiomyopathie dilatée | 14 | 0,1 | 7,6 x 10-3 | 1,2 x 10-1 |
Fonction neuronale | ||||
Potentialisation à long terme | 11 | 0,1 | 1.5 x 10-2 | 1. 4 x 10-1 |
De signalisation | ||||
Voie de signalisation MAPK | 35 | 0,2 | 2,4 x 10-4 | 9,9 x 10-3 |
Voie de signalisation calcique | 22 | 0,1 | 1,2 x 10-2 | 1. 4 x 10-1 |
Voie de signalisation de chimiokine | 21 | 0,1 | 1,2 x 10-2 | 1,3 x 10-1 |
Cancer | ||||
Voies du cancer | 42 | 0,3 | 4.1 x 10-5 | 3.4 x 10-3 |
Gliome | 15 | 0,1 | 4.4 x 10-5 | 2,4 x 10-3 |
Cancer du poumon non à petites cellules | 10 | 0,1 | 7,9 x 10-3 | 1,1 x 10-1 |
Cancer colorectal | 13 | 0,1 | 8,4 x 10-3 | 1,1 x 10-1 |
Leucémie myéloïde chronique | 12 | 0,1 | 1,2 x 10-2 | 1,3 x 10-1 |
Tableau 4 : Analyse KEGG voie de DMR identifié chez le rat méthyl-suiv.
Dans cette étude, nous avons conçu et mis en œuvre de la plate-forme de méthyl-Seq pour le génome du rat. En faisant preuve de son utilité avec un modèle de rat du stress, nous avons démontré que le pipeline expérimental et analytique peut fournir des régions différentiellement méthylées entre deux groupes de comparaison.
Afin d’assurer une mise en œuvre de la plate-forme, plusieurs étapes critiques doivent être respectés. Première qualité de l’ADN et la quantité a un impact significatif sur la qualité et la quantité de la bibliothèque de méthyl-Seq finale. Nous avons utilisé un fluorimètre, plutôt que d’un spectrophotomètre, pour s’assurer que nos mesures d’ADN reflète la quantité d’ADN double brin. Le bioanalyzer a été utilisé pour mesurer la taille moléculaire et la quantité d’ADN après la tonte et après ligature de l’adaptateur. Vérifier la taille de la molécule « décalage » entre ces étapes est essentielle confirmer la présence des adaptateurs aux extrémités de chaque fragment d’ADN qui fera l’objet d’adaptateur-mediated PCR dans les étapes ultérieures. La quantité d’ADN à la fin de l’étape de la ligature d’adaptateur est également importante, depuis au moins 100 ng du produit bibliothèque est nécessaire à cette étape afin d’assurer une quantité suffisante est disponible après les étapes de conversion enrichissement et bisulfite de cible. Une mesure de haute sensibilité finale a été réalisée sur la bibliothèque de méthyl-Seq construite afin que la bibliothèque peut être correctement diluée pour le clustering ultérieures sur le séquenceur de prochaine génération. Enfin, bisulfite pyrosequencing travaillait comme une méthode très quantitative, indépendante pour évaluer la précision du pipeline analytique. La validation finale avec les échantillons et réplication à l’aide d’animaux supplémentaires d’origine sont des étapes cruciales pour assurer que l’expérience peut détecter des changements biologiquement significatifs dans la méthylation de l’ADN.
Nous incluons également plusieurs lignes directrices en cas d’écart par rapport au protocole ou si des problèmes sont rencontrés. Tout d’abord, il est possible de perdre trop d’ADN au cours de la fin-réparation, ligature de l’adaptateur ou étapes de purification des billes magnétiques. Par ailleurs, à partir des quantités d’ADN pourrait être petit (< 200 ng) en raison de la disponibilité limitée des tissus/ADN ou mise en œuvre des différentes méthodes d’enrichissement telles que le tri des cellules fluorescence activé. Augmentant le nombre de cycles au cours des étapes de l’amplification de deux bibliothèques peut être en mesure de compenser la perte excessive de l’ADN ou faible à partir de quantité d’ADN dans tout le protocole de construction de bibliothèque. Cependant, pas plus qu’un autre cycles 2 et 3 sont recommandés, comme l’amplification excessive modèle est susceptible d’entraîner une augmentation du nombre de lectures en double en cours de séquençage. Ces doublons sont exclus pendant l’étape de l’alignement afin d’éviter les biais dans le calcul du pourcentage de méthylation. Deuxièmement, si la taille moyenne des ADN n’augmente pas de plus de 30 points de base, vérifiez que les réactifs sont nouvelles, comme T4 ADN polymérase, Klenow et/ou T4 ligase peut être vieux. Réactifs de rechange disponibles dans le commerce peuvent être utilisés.
En outre, il est possible que le DMR prévue ne pourrait pas valider par pyrosequencing, où les différences de méthylation de l’ADN n’existent pas ou sont sensiblement inférieures à celles prédites par analyse. Validation pauvre des régions de candidat est un problème trop commun pour nombre d’analyses Génome-large, par exemple quand pyrosequencing résultats ne confirment pas la méthylation différentielle ou l’ampleur de l’effet est beaucoup plus petite que celle prédite par l’analyse. BSmooth est un paquet analytique qui « lisse » les niveaux de la méthylation dans une fenêtre des GPC multiples. Pour l’expérience en cours, BSmooth mis en cause un DMR dont les niveaux de méthylation ont été validés par le bisulfite pyrosequencing. Cependant, il y aura probablement des différences entre les niveaux de méthylation prévues par BSmooth et celles vérifiées par pyrosequencing. Les écarts résultent de la fonction de lissage qui permet d’estimer les valeurs moyennes de la méthylation dans l’ensemble de la GPC dans un DMR, y compris consécutifs GPC qui peut-être différer dans la méthylation de l’ADN de plus de 50 % ou GPC dont les valeurs de méthylation ont été exclus due à sous seuil lire la profondeur. R-paquets comme MethylKit24 peuvent servir à identifier les petites fenêtres de GPC ou même unique GPC qui le taux de méthylation corréler fortement avec ceux validés par pyrosequencing. Mise en œuvre de différents forfaits et tester leurs régions prévues ou GPC de méthylation différentielle par pyrosequencing assurera la solidité des données. Alternativement, bibliothèques de méthyl-Seq originales peuvent être reséquencées et ajoute les fichiers lus pour augmenter la profondeur. Étant donné que la détermination des niveaux de méthylation sont semi-quantitatifs et dicté par le nombre de lectures [(# of CpGs) / (nombre de TpGs + GPC)], augmentant la profondeur pour un CpG donnée augmentera la précision de sa valeur de pourcentage de méthylation. Dans cette étude, nous avons ne considéré que GPC dont les valeurs de méthylation ont été déterminées par au moins dix lectures et atteint une couverture globale de lecture de 19 x pour chaque CpG.
La plate-forme de méthyl-Seq de rat n’est pas sans ses limites. Bien qu’il soit plus rentable que le séquençage du génome entier bisulfite, c’est beaucoup plus cher que les autres méthodes. Néanmoins, la plupart des coûts a été pour l’achat de voies sur le séquenceur et non pour le système de capture. Selon la profondeur nécessaire, avec des comparaisons de croix-tissus nécessitant moins en raison de différences de grande (25 à 70 %)12 dans la méthylation de l’ADN, le coût peut être réduit par multiplexage plus d’échantillons par voie de circulation et à l’aide d’une plateforme de plus grande capacité. En outre, la préparation de l’échantillon est plus de temps que d’autres méthodes. Bien que similaire aux autres approches pulldown qui incorporent le séquençage de nouvelle génération, les étapes de purification et de conversion de bisulfite supplémentaire ajoutent à la charge de travail. Dans l’ensemble, la plate-forme de méthyl-Seq est une alternative rentable au séquençage du génome entier et offre une résolution paires de bases à plus de 2,3 millions de GPC, qui est beaucoup plus que ceux analysés par microarray-plateformes. À ce jour, l’homme disponibles sur le marché et la souris, méthyl-Seq plates-formes ont été utilisés pour documenter les changements d’alcooliques dans le macaque cerveau25,26, sur le développement neurologique des gènes dans le cerveau de souris9et hémato-encéphalique cibles de glucocorticoïdes10. En outre, la possibilité de cibler des régions spécifiques, indépendamment de la reconnaissance de séquences par des enzymes de restriction rend une plate-forme idéale pour les comparaisons entre les espèces. Pour cette étude, nous avons conçu la plate-forme méthyl-Seq pour le rat, pour laquelle de nombreuses expériences pharmacologiques, métaboliques et comportementales sont effectuées sans le bénéfice d’un outil de Génome-large méthylomiques. Nos résultats montrent qu’il peut être utilisé pour détecter les DMR dans un modèle de rat de stress et autres paramètres physiologiques tels que Global plasmatique CORT en corrélation.
La plateforme de méthyl-Seq est idéale pour des expériences épigénétiques chez les animaux avec des génomes séquencés qui ne disposent pas de suffisamment de preuves expérimental documentant les régions régulatrices. Lorsque ces régions sont mises à disposition, des régions supplémentaires peuvent être personnalisés et attachées à la version actuelle. En outre, la plateforme est idéale pour la génomique comparative, étant donné que l’enrichissement de la cible n’est pas limité par la reconnaissance de l’enzyme de restriction. Par exemple, la région du promoteur d’un gène d’intérêt peut être capturée indépendamment de savoir si elle abrite un site de restriction spécifique. De même, les régions régulatrices, comme celles de la souris ou des humains, qui sont conservées dans le génome d’intérêt peuvent être capturées.
Le manuscrit fait partie d’un prix du concours d’Agilent Technologies.
Cette étude a été financée par les NIH grant MH101392 (RSL) et de soutien des prix et fondations suivantes : un NARSAD Young Investigator Award, Margaret Ann prix enquêteur, le James Wah Mood Disorders érudit fonds via le Charles T. Bauer Foundation, Baker Foundation et la projet Match Foundation (RSL).
Name | Company | Catalog Number | Comments |
Radioimmuno assay (RIA) | MP Biomedicals | 7120126 | Corticosterone, 125I labeled |
Master Pure DNA Purification Kit | Epicentre/Illumina | MC85200 | |
Thermal-LOK 2-Position Dry Heat Bath | USA Scientific | 2510-1102 | Used with 1.5 mL tubes |
Vortex Genie 2 | Fisher | 12-812 | Vortex Mixer |
Ethyl alcohol, Pure | Sigma-Aldrich | E7023 | 100% Ethanol, molecular grade |
Centrifuge 5424 R | Eppendorf | - | Must be capable of 20,000 x g |
Qubit 2.0 | ThermoFisher Scientific | Q32866 | Fluorometer |
Qubit dsDNA BR Assay Kit | ThermoFisher Scientific | Q32850 | |
Qubit dsDNA HS Assay Kit | ThermoFisher Scientific | Q32851 | High sensitivity DNA detection reagents |
Qubit Assay Tubes | ThermoFisher Scientific | Q32856 | |
SureSelectXT Rat Methyl-Seq Reagent Kit | Agilent Technologies | G9651A | Reagents for preparing the Methyl-Seq library |
SureSelect Rat Methyl-Seq Capture Library | Agilent Technologies | 931143 | RNA baits for enrichment of rat targets |
IDTE, pH 8.0 | IDT DNA | 11-05-01-09 | 10 mM TE, 0.1 mM EDTA |
DNA LoBind Tube 1.5 mL | Eppendorf | 22431021 | |
Covaris E-series or S-series | Covaris | - | Isothermal sonicator |
microTUBE AFA Fiber Pre-Slit Snap-Cap 6x16mm (25) | Covaris | 520045 | |
Water, Ultra Pure (Molecular Biology Grade) | Quality Biological | 351-029-721 | |
Veriti 96 Well-Thermal Cycler | Applied Biosystems | 4375786 | |
AMPure XP Beads | Beckman Coulter | A63880 | DNA-Binding magnetic beads |
96S Super Magnet | ALPAQUA | A001322 | Magnetic plate for purification steps |
2200 TapeStation | Agilent Technologies | G2965AA | Electrophresis-based bioanalyzer |
D1000 ScreenTape | Agilent Technologies | 5067-5582 | |
D1000 ScreenTape High Sensitivity | Agilent Technologies | 5067-5584 | |
D1000 Reagents | Agilent Technologies | 5067-5583 | |
D1000 Reagents High Sensitivity | Agilent Technologies | 5067-5585 | |
DNA110 SpeedVac | ThermoFisher Scientific | - | Vacuum Concentrator |
Dynabeads MyOne Streptavidin T1 magnetic beads | Invitrogen | 65601 | Streptavidin magnetic beads |
Labquake Tube Rotator | ThermoFisher Scientific | 415110Q | Nutator Mixer is also acceptable |
EZ DNA Methylation-Gold Kit | Zymo Research | D5006 | Bisulfite conversion kit. Contains Binding, Wash, Desulphonation, and Elution buffers |
Illumina Hi-Seq 2500 | Illumina | - | Next-generation sequencing machine |
PCR and Pyrosequencing Primers | IDT DNA | Variable | |
Taq DNA Polymerase with ThermoPol Buffer - 2,000 units | New England BioLabs | M0267L | |
Deoxynucleotide (dNTP) Solution Set | New England BioLabs | N0446S | |
Pyromark MD96 | QIAGEN | - | Pyrosequencing machine |
Ethyl Alcohol 200 Proof | Pharmco-Aaper | 111000200 | 70% Ethanol solution |
Sodium Hydroxide Pellets | Sigma-Aldrich | 221465 | 0.2 M NaOH denature buffer solution |
Tris (Base) from J.T. Baker | Fisher Scientific | 02-004-508 | 10 mM Tris Acetate Buffer wash buffer solution |
PyroMark Gold Q96 Reagents (50x96) | QIAGEN | 972807 | Reagents required for pyrosequencing |
PyroMark Annealing Buffer | QIAGEN | 979009 | |
PyroMark Binding Buffer (200 mL) | QIAGEN | 979006 | |
Streptavidin Sepharose High Performance Beads | GE Healthcare | 17-5113-01 | Streptavidin-coated sepharose beads |
PyroMark Q96 HS Plate | QIAGEN | 979101 | Pyrosequencing assay plate |
Eppendorf Thermomixer R | Fisher Scientific | 05-400-205 | Plate mixer. 96-well block sold separately (cat. No 05-400-207) |
SureDesign Website | Agilent Technologies | - | Target capture design software (https://earray.chem.agilent.com/suredesign/) |
UCSC Genome Browser | University of California Santa Cruz | - | rat Nov 2004 rn4 assembly |
Agilent Methyl-Seq Protocol | Agilent Technologies | - | https://www.agilent.com/cs/library/usermanuals/public/G7530-90002.pdf |
Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE
Demande d’autorisationThis article has been published
Video Coming Soon