Long-lire des séquences facilitent considérablement l’assemblage des génomes complexes et caractérisation de variation structurale. Les auteurs décrivent une méthode pour générer des séquences ultra longues de plateformes de séquençage nanopore-basé. L’approche adopte une extraction d’ADN optimisée suivie de préparations de bibliothèque modifiée pour générer des centaines de kilobases se lit avec une couverture modérée à partir des cellules humaines.
Troisième génération de technologies de séquençage de l’ADN molécule unique offrent nettement plus longtemps lire longueur qui peut faciliter le montage des génomes complexes et l’analyse des variantes structurales complexes. Plates-formes Nanopore effectuent seule molécule séquençage en mesurant directement les changements actuels médiées par le passage de l’ADN à travers les pores et peuvent générer des centaines de lectures kilobases (kb) avec le coût en capital minime. Cette plate-forme a été adoptée par de nombreux chercheurs pour une variété d’applications. Réalisation de plus longues longueurs de lecture de séquençage est le facteur le plus critique de tirer parti de la valeur des plateformes de séquençage nanopore. Pour générer des lectures ultra longues, une attention particulière est nécessaire pour éviter les ruptures de l’ADN et de gagner en efficacité pour générer des modèles productifs de séquençage. Ici, nous fournissons le protocole détaillé de séquençage de l’ADN ultra long dont le poids moléculaire élevé (HMW) extraction de l’ADN des cellules fraîches ou congelées, construction de la bibliothèque de cisaillement mécanique ou une fragmentation de la transposase et le séquençage sur un périphérique nanopore. De 20 à 25 µg d’ADN HMW, la méthode peut atteindre N50 lire longueur de 50 à 70 KO avec le cisaillement mécanique et N50 de 90-100 kb lire la longueur avec la transposase médiée par fragmentation. Le protocole peut être appliqué à l’ADN extrait des cellules de mammifères pour effectuer le séquençage du génome entier pour la détection des variantes structurelles et assemblage de génome. Des améliorations supplémentaires sur l’extraction de l’ADN et les réactions enzymatiques vont encore augmenter la durée de lecture et élargir son utilité.
Ces dix dernières années, massivement parallèle et technologies de haute précision deuxième génération haut débit séquençage ont conduit à une explosion de découverte biomédicale et de l’innovation technologique1,2,3. Malgré les progrès techniques, le court-lecture de données générées par les plateformes de deuxième génération est inefficaces à résoudre les régions génomiques complexes et est limités dans la détection des variants structurels génomiques (SVs), qui jouent un rôle important dans l’homme Evolution et maladies4,5. En outre, court-lecture de données est incapables de résoudre la répétition de variation et ne conviennent pas pour les hautes haplotype progressive des variants génétiques6.
Les progrès récents dans le séquençage de la molécule unique offre significativement plus longue lire la longueur, ce qui peut faciliter la détection de l’éventail complet des SVs7,8,9et offres Assemblée précise et complète du complexe génomes microbiens et mammifères6,10. La plate-forme nanopore effectue seule molécule séquençage en mesurant directement les changements actuels médiées par le passage de l’ADN dans les pores de12,11,13. Contrairement à toute chimie de séquençage ADN existante, nanopore séquençage peut générer long (des dizaines de milliers de kilobases) se lit comme suit en temps réel sans avoir à compter sur la cinétique de la polymérisation ou artificielle l’amplification de l’échantillon d’ADN. Par conséquent, nanopore long lire séquençage (NLR-seq) détient très prometteur pour la génération ultra grandes longueurs de lecture bien au-delà de 100 Ko, ce qui ferait progresser considérablement les analyses génomiques et biomédicales14, particulièrement dans la faible complexité ou riches en répétition régions des génomes15.
La caractéristique unique de séquençage nanopore est sa capacité à générer des longues lectures sans limitation de durée théorique. Par conséquent, la longueur de lecture dépend de la longueur physique de l’ADN qui est directement touchée par la qualité de modèle intégrité et séquençage de l’ADN. En outre, selon l’ampleur de la manipulation et le nombre d’étapes impliquées, comme forces de pipetage et les conditions d’extraction, la qualité de l’ADN est très variable. Il est donc difficile pour que l'on puisse céder lectures longues en appliquant simplement les protocoles d’extraction d’ADN standards et des méthodes de construction de la bibliothèque fournie du fabricant. À cette fin, nous avons développé une solide méthode permettant de générer ultra-longue lire (des centaines de kilobases) données de séquençage à partir de granulés de cellules récoltées. Nous avons adopté plusieurs améliorations dans les procédures de préparation ADN extraction et bibliothèque. Nous avons simplifié le protocole afin d’exclure des procédures inutiles qui causent des dommages-intérêts et la dégradation de l’ADN. Ce protocole est composé de poids moléculaire élevé (HMW) extraction d’ADN, ultra longue construction de bibliothèque d’ADN et le séquençage sur une plate-forme nanopore. Pour un biologiste moléculaire bien formé, cela prend généralement de 6 h de cellule récolte jusqu'à l’achèvement de HMW DNA extraction, 90 min ou 8 h pour la construction de la bibliothèque selon la méthode de cisaillement et jusqu'à une autre 48 h pour le séquençage de l’ADN. L’utilisation du protocole permet à la communauté de la génomique afin d’améliorer notre compréhension de la complexité du génome et avoir un nouvel aperçu variation génomique dans les maladies humaines.
Remarque : Le protocole NLR-seq se compose de trois étapes successives : 1) extraction de grande molécularité poids ADN génomique (HMW) ; 2) ultra longue construction de bibliothèque d’ADN, qui comprend la fragmentation de l’ADN de HMW dans les tailles souhaitées et ligature des adaptateurs de séquençage de l’ADN se termine ; et 3) chargement de l’ADN adaptateur-ligaturé sur les baies de nanopores (Figure 1).
1. extraction d’ADN de HMW
2. ultra longue construction de bibliothèque d’ADN
Remarque : Il y a deux façons pour construire les bibliothèques d’ADN ultra longues issus des deux méthodes différentes de cisaillement couplés avec nanopore kits de séquençage. Une bibliothèque de cisaillement mécanique génère des données avec un N50 de 50 à 70 Ko, prenant environ 8 h pour la construction de la bibliothèque. Une bibliothèque transposase fragmentation produit un N50 de 90-100 Ko de données, en prenant seulement 90 min pour la construction de la bibliothèque. Le protocole de cisaillement mécanique donne un rendement plus élevé de l’ADN même introduit au moyen de versions identiques de l’adaptateur de séquençage et de la qualité des cellules d’écoulement nanopore.
3. séquençage sur le périphérique nanopore
HMW ADN s’applique le protocole de séquençage ADN ultra long pour la construction de la bibliothèque. Par conséquent, il est essentiel de choisir les cellules bien cultivées avec un rapport direct > 85 % à la cellule à l’étape de récolte. La quantité de cellules utilisée pour l’extraction d’ADN aura une incidence sur la qualité et la quantité de l’ADN de HMW. La lyse cellulaire ne fonctionne pas bien si commençant par trop de cellules. En utilisant des cellules trop peu ne génère pas suffisamment d’ADN pour la construction de la bibliothèque, car la précipitation de l’ADN HMW est effectuée à l’aide de rotation douce à la main au lieu de centrifugation à haute vitesse. Un exemple de l’ADN de HMW après que ajout glacé 100 % d’éthanol et la rotation sont montré comme le précipité blanc de coton-comme à la Figure 2.
Il est important de vérifier la qualité de l’ADN d’entrée avant de commencer la construction de la bibliothèque. Dégradation, quantification incorrecte, contamination (par exemple, protéines, ARN, détergents, tensioactifs et phénol résiduel ou éthanol) et faible poids moléculaire ADN peuvent avoir un effet significatif sur les procédures ultérieures et sur la finale lire la longueur. Nous recommandons de procéder de l’analyse QC à l’aide de l’ADN de trois endroits différents dans le tube contenant de l’ADN de HMW. De UV lecture des résultats de l’ADN de HMW, la valeur do260/OD280 est environ 1,9 et la valeur do260/OD230 est environ 2.3 (Figure 3 aB). Ces valeurs de ratio sont compatibles entre les trois tests pour un échantillon d’ADN de HMW bon. Différentes méthodes de cisaillement nécessite des volumes différents de l’ADN d’entrée. La concentration d’ADN de HMW doit être > 200 ng/µL de cisaillement mécanique alors qu’il doit être > 1 µg/µL de fragmentation de la transposase. La concentration détectée par un fluorimètre est un peu inférieure à UV lecture. Toutefois, le coefficient de variation de la concentration de l’échantillon d’ADN de HMW même devra être inférieur à 15 % avec le fluorimètre et le UV, lecture d’épreuves. Tonte mécanique s’applique une seringue avec une aiguille pour casser l’ADN HMW afin que le nombre de passes par l’intermédiaire de l’aiguille aura une incidence la taille de l’ADN cisaillé et lire de la finale de la longueur. Il est recommandé d’effectuer la taille QC après que aiguille tonte afin d’assurer la majorité de l’ADN de HMW est supérieure à 50 Ko comme illustré à la Figure 4. Dans la méthode de cisaillement mécanique, 30 passes a généré les meilleurs résultats de séquençage, compte tenu de la longueur et la sortie.
La N50 d’une bibliothèque de base cisaillement mécanique est 50-70 kb tandis qu’une transposase axée sur la fragmentation bibliothèque est de 90-100 Ko. Les résultats de quatre essais en utilisant la lignée cellulaire de HG00733 sont indiqués dans le tableau 1. Tous les quatre descentes ont plus 2 300 lectures avec une longueur de plus de 100 Ko. La longueur maximale est plus longue dans les transposase axée sur la fragmentation bibliothèques (455 Ko et 489ko) comparés avec les bibliothèques de base cisaillement mécaniques (348ko et 387 kb) alors que ce dernier produit plus de lectures totales, ce qui indique un rendement plus élevé. La construction de bibliothèque fragmentation transposase a moins de marches et de temps de préparation plus courte afin qu’elle introduira moins courts fragments. Les deux pistes à l’aide de la transposase ont une longueur moyenne supérieure (> 30 Ko) et la durée médiane (> 10 Ko). En outre, les données montrent une qualité élevée constante dans toutes les séries (score de qualité moyenne est environ 10,0, précision de base d’origine ~ 90 %). Plus de 97 % des bases totales étaient alignés au génome humain de référence (hg19) à l’aide de Minimap216 avec les paramètres par défaut. Les distributions de la taille attendue des lectures brutes sont indiquées à la Figure 5. Toutes les séries ont une grande partie des données dépassant les 50 Ko tandis que transposase axée sur la fragmentation des bibliothèques ont un ratio plus élevé de lectures ultra longues (p. ex. > 100 Ko). Ce protocole a été appliqué avec succès dans plusieurs lignées de cellules humaines (complémentaires tableau 1).
Figure 1 : vue d’ensemble schématique du workflow nanopore séquençage long-read (NLR-seq). Orange, la transposase complexe. Jaune-vert, l’adaptateur nanopore. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.
Figure 2 : précipitations d’ADN représentant de méthode d’extraction de phénol-chloroforme. La flèche blanche indique l’ADN HMW. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.
Figure 3 : résultats de QC de l’exemple de l’ADN de HMW de lecture UV. ADN de HMW (A) de l’étape 1.21.1 prêt pour la construction de la bibliothèque de base cisaillement mécanique. ADN de HMW (B) de l’étape 1.21.2 pour construction de bibliothèque axée sur la fragmentation de transposase. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.
Figure 4 : résultats QC de l’aiguille cisaillement HMW ADN par électrophorèse sur gel en champ pulsé. L1 : Quick charge 1Ko échelle d’ADN ; L2 : Quick charge 1Ko étendre échelle d’ADN. 1-8 : ADN avec des temps de passage différents par le biais de la tonte de l’aiguille. 1-3, aucune tonte ; 4, 10 fois ; 5, 20 fois ; 6, 30 fois ; 7, 40 fois ; 8, 50 fois. Cette étape QC est facultative. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.
Figure 5 : prévu des distributions granulométriques des bibliothèques nanopore ADN ultra-longue. MS, bibliothèques de base cisaillement mécaniques. TF, transposase axée sur la fragmentation des bibliothèques. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.
Shearing_rep1 mécanique | Shearing_rep2 mécanique | Transposase fragmentation_rep1 | Transposase fragmentation_rep2 | |
Lignée cellulaire | HG00733 | HG00733 | HG00733 | HG00733 |
N50 les lectures | 55 180 | 63 007 | 98 237 | 95 629 |
Nombre de lectures plus de 100ko | 2 500 | 3 082 | 2 386 | 2 355 |
Nombre de lit total | 97 859 | 80 465 | 24 166 | 21 032 |
Longueur maximale (bp) | 348 482 | 387 113 | 454 660 | 489 426 |
Longueur moyenne (bp) | 17 861 | 20 395 | 33 528 | 38 175 |
Durée médiane (bp) | 5 335 | 5 894 | 10 249 | 15 656 |
Qualité moyenne des lectures | 10.0 | 10.1 | 9,9 | 10.0 |
Totales bases de lectures brutes | 1,747,849,822 | 1,641,058,932 | 810,229,733 | 802,886,304 |
Totales bases alignées lectures | 1,693,300,832 | 1,607,975,925 | 791,422,077 | 778,417,627 |
Mappés ratio du totales bases (hg19, Minimap2) | 96,9 % | 98,0 % | 97,7 % | 97,0 % |
Nombre de pores actives | 1225 : 480, 402, 254, 89 | 1058 : 480, 356, 176, 46 | 958 : 452, 328, 148, 30 | 1092 : 487, 367, 195, 43 |
Tableau 1 : Sommaire des indicateurs de Performance fonctionne avec différents protocoles de cisaillement.
Bibliothèque 1 | Bibliothèque 2 | |
Lignée cellulaire | K562 | GM19240 |
Cellule Information de commande | ATCC, cat. Lol CCL-243 | Coriell Institute, cat. Lol GM19240 |
Protocole | tonte mécanique | tonte mécanique |
N50 les lectures | 60 063 | 55 295 |
Nombre de lit total | 193 783 | 120 807 |
Durée médiane (bp) | 1 843 | 4 688 |
Longueur moyenne (bp) | 9 825 | 17 408 |
Longueur maximale (bp) | 548 780 | 212 338 |
Totales bases de lectures brutes | 1,903,989,686 | 2,103,015,331 |
Totales bases alignées lectures | 1,837,350,047 | 1,997,419,761 |
Mappés ratio du totales bases (hg19, Minimap2) | 96,6 % | 95,0 % |
Nombre de pores actives | 1111 : 482, 371, 203, 55 | 1032 : 447, 333, 196, 56 |
Supplémentaire tableau 1 : Résumé de deux courses de NLR-seq en utilisant d’autres lignées cellulaires avec le protocole de cisaillement mécanique.
En principe, nanopore séquençage est capable de produire 100 Ko de megabase lectures en longueur11,12,13. Quatre principaux facteurs affectera les performances de la qualité de course et les données de séquençage : 1) nombre de pores actifs et l’activité des pores ; 2) protéine moteur, qui contrôle la vitesse de l’ADN en passant par le nanopore ; 3) modèle ADN (longueur, pureté, qualité, masse) ; 4) séquençage adaptateur ligature efficacité, ce qui détermine l’ADN utilisable de l’échantillon d’entrée. Les deux premiers facteurs dépendent de la version de la cellule d’écoulement et le kit de séquençage fournies par le fabricant. Les deux facteurs sont des étapes cruciales dans le présent protocole (extraction d’ADN de HMW, cisaillement et ligature).
Ce protocole requiert patience et pratique. La qualité de l’ADN de HMW est importante pour les bibliothèques6de l’ADN ultra longue. Le protocole commence par cellules recueillies avec viabilité élevée (> 85 % des cellules viables préféré), limitant l’ADN dégradé des cellules mortes. Tout processus rigoureux qui peuvent introduire des dommages à l’ADN (par exemple, fort dérangeant, secouant, vortex, multiples pipetage, répétées gel et dégel) doit être évitée. Dans la conception du protocole, nous omettons pipetage dans l’ensemble du processus d’extraction de l’ADN. Conseils d’alésage large doivent être utilisées lorsque le pipetage est nécessaire après le cisaillement mécanique pendant la construction de la bibliothèque et le séquençage. Comme les nanopores sont sensibles aux chimies dans le tampon de chambre12, il doit être aussi peu contaminants résiduels (par exemple, les détergents, agents tensio-actifs, phénol, éthanol, protéines, ARN, etc.) que possible dans l’ADN. Compte tenu de la longueur et le rendement, la méthode d’extraction de phénol montre des résultats meilleurs et plus reproductibles comparés avec plusieurs différentes méthodes d’extraction testées jusqu'à présent.
Malgré la capacité du présent protocole pour produire des séquences de lecture longue, plusieurs limitations subsistent. Tout d’abord, ce protocole a été optimisé basé sur l’appareil de séquençage nanopore disponible au moment de la publication ; ainsi, il est limité à la chimie sélective axée sur les nanopore séquençage et pourrait être sous-optimal lorsque effectuées dans d’autres types d’appareils de séquençage long à lire. En second lieu, le résultat est fortement tributaire de la qualité de l’ADN extrait de la matière (tissus ou cellules). Longueur de lecture sera compromise si l’ADN de départ est déjà dégradé ou endommagé. Troisièmement, bien que plusieurs étapes QC sont incorporés dans le protocole pour vérifier la qualité de l’ADN, le rendement final et la longueur de la lecture peuvent être affectées par la cellule de flux et activité, ce qui pourrait être variable à ce stade précoce de la plate-forme de séquençage nanopore des pores développement.
Le protocole décrit ici utilise des échantillons de ligne de cellules humaines de suspension pour l’extraction de l’ADN. Nous avons optimisé les temps de passage en aiguille de cisaillement, le ratio d’ADN HMW transposase et le moment de ligature pour produire les résultats décrits. Le protocole peut être augmenté de quatre façons. Tout d’abord, les utilisateurs peuvent démarrer avec d’autres cellules mammifères cultivées et avec des montants différents de cellules, tissus, échantillons cliniques ou d’autres organismes. Optimisation sur les temps d’incubation de lyse, volume réactionnel et centrifugation est nécessaires. Deuxièmement, il est difficile de prédire la taille cible pour le séquençage ultra longue lecture. Si la longueur de lecture est plus courte que prévu, les utilisateurs peuvent ajuster les temps de passage dans la méthode cisaillement mécanique ou changer le ratio de l’ADN de HMW à transposase dans la méthode axée sur la fragmentation de transposase. Liaison et élution longtemps durant les étapes de nettoyage sont utiles parce que l’ADN HMW est très visqueux. Troisièmement, avec nanopore différents appareils de séquençage, on peut ajuster la quantité et le volume de l’ADN pour remplir les critères du séquenceur. Quatrièmement, seulement ces ADN ligaturé aux adaptateurs de séquençage va être séquencé. Afin d’améliorer l’efficacité de la ligature, on peut essayer de titrer les concentrations de l’adaptateur et la ligase. Ligature des mis à jour le temps et les agents encombrement moléculaires comme PEG18 peuvent être appliquées à l’avenir. Le protocole de séquençage de l’ADN ultra long combiné avec CRISPR19,20 peut offrir un outil efficace pour l’ordonnancement de l’enrichissement de cible.
Les auteurs déclarent qu’ils n’ont aucun intérêt financier concurrentes.
Les auteurs remercient Y. Zhu pour ses commentaires sur le manuscrit. Recherche rapporté dans cette publication a été partiellement financée par le National Cancer Institute de la National Institutes of Health, sous attribution numéro P30CA034196. Le contenu est la seule responsabilité des auteurs et ne représente pas nécessairement l’opinion officielle de la National Institutes of Health.
Name | Company | Catalog Number | Comments |
Reagents | |||
Absolute ethanol | Sigma-Aldrich | E7023 | |
Agencourt AMPure XPbeads | Beckman | A63881 | magnetic beads for cleanup |
BD conventional needles | Becton Dickinson | 305136 | 27G, for mechanical shearing |
BD Luer-Lok syringe | Becton Dickinson | 309628 | for mechanical shearing |
Blunt/TA Ligase Master Mix | NEB | M0367S | |
Countess Cell Counting Chamber Slides | Invitrogen | C10228 | for cell counting |
EDTA | Invitrogen | AM9261 | pH 8.0, 0.5 M, 500 mL |
Flow Cell | Oxford Nanopore Technologies | FLO-MIN106 | R9.4.1 |
HG00773 cells | Coriell Institute | HG00733 | cells used in this protocol |
Ligation Sequencing Kit 1D | Oxford Nanopore Technologies | SQK-LSK108 | nanopore ligation kit |
MaXtract High Density tubes | Qiagen | 129073 | gel tubes |
NEBNext FFPE DNA Repair Mix | NEB | M6630S | |
NEBNext Ultra II End Repair/dA-Tailing Module | NEB | M7546S | |
Nuclease-free water | Invitrogen | AM9937 | |
Phosphate-Buffered Saline, PBS | Gibco | 70011044 | 10X, pH 7.4 |
Phenol:chloroform:IAA | Invitrogen | AM9730 | |
Proteinase K | Qiagen | 19131 | 20 mg/mL |
Qubit dsDNA BR Assay Kit | Invitrogen | Q32850 | fluorometer assays for DNA quantification |
Rapid Sequencing Kit | Oxford Nanopore Technologies | SQK-RAD004 | nanopore transposase kit |
RNase A | Qiagen | 19101 | 100 mg/mL |
SDS | Invitrogen | AM9822 | 10% (wt/vol) |
Sodium chloride solution | Invitrogen | AM9759 | 5.0 M |
TE buffer | Invitrogen | AM9849 | pH 8.0 |
Tris | Invitrogen | AM9856 | pH 8.0, 1 M |
Triton X-100 solution | Sigma-Aldrich | 93443 | ~10% |
Name | Company | Catalog Number | Comments |
Equipment | |||
Bio-Rad C1000 Thermal Cycler | Bio-Rad | 1851196EDU | |
Centrifuge 5810R | Eppendorf | 22628180 | |
Countess II FL Automated Cell Counter | Life Technologies | AMQAF1000 | for cell counting |
DynaMag-2 Magnet | Life Technologies | 12321D | magnetic rack |
Eppendorf ThermoMixer | Eppendorf | 5382000023 | for incubation |
Freezer | LabRepCo | LHP-5-UFMB | |
GridION | Oxford Nanopore Technologies | GridION X5 | nanopore device used in this protocol |
HulaMixer Sample Mixer | Thermo Fisher Scientific | 15920D | rotator mixer |
MicroCentrifuge | Benchmark Scientific | C1012 | |
NanoDrop ND-1000 Spectrophotometer | Thermo Fisher Scientific | ND-1000 | for UV reading |
Pippin Pulse | Sage Science | PPI0200 | pulsed-field gel electrophoresis instrument |
Qubit 3.0 Fluorometer | Invitrogen | Q33216 | fluorometer |
Refrigerator | LabRepCo | LABHP-5-URBSS | |
Vortex-Genie 2 | Scientific Industries | SI-A236 | |
Water bath | VWR | 89501-464 |
Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE
Demande d’autorisationThis article has been published
Video Coming Soon