Method Article
Characterizing microbial community has been a longstanding goal in environmental microbiology. Next-generation sequencing methods now allow for the characterization of microbial communities at an unprecedented depth with minimal cost and labor. We detail here our approach to sequence bacterial 16S ribosomal RNA genes using a benchtop sequencer.
L'une des grandes questions de l'écologie microbienne est "qui est là?" Cette question peut être répondue en utilisant divers outils, mais l'une des règles d'or de longue durée est de séquencer amplicons 16S ARN ribosomique (ARNr) de gènes générées par PCR au niveau du domaine Les réactions d'amplification de l'ADN génomique. Traditionnellement, cela a été réalisé par clonage et Sanger (électrophorèse capillaire) séquençage des amplicons PCR. L'avènement de séquençage de nouvelle génération a énormément simplifié et une augmentation de la profondeur de séquençage pour le séquençage du gène de l'ARNr 16S. L'introduction de séquenceurs de paillasse permet maintenant de petits laboratoires à effectuer leur séquençage 16S de l'ARNr en interne dans une affaire de jours. Ici, une approche pour l'ARNr 16S séquençage de l'amplicon du gène en utilisant une paillasse de séquenceur de nouvelle génération est détaillé. L'ADN de l'environnement est d'abord amplifié par PCR en utilisant des amorces qui contiennent des adaptateurs de séquençage et des codes barres. Ils sont ensuite couplés à des particules sphériques émulsion via PCR. Les particules sont de loaded sur une puce jetable et la puce est insérée dans la machine de mise en séquence, après quoi le séquençage est effectué. Les séquences sont récupérés sous forme fastq, filtrées et les codes à barres sont utilisés pour déterminer la composition des échantillons du lit. Le filtré et mis en cellule lectures sont ensuite analysées en outre l'utilisation des outils accessibles au public. Une analyse de l'exemple où lectures ont été classés avec un algorithme de taxonomie trouver dans le logiciel mothur est donnée. La méthode décrite ici est simple, peu coûteux et simple et devrait aider les petits laboratoires de profiter de la révolution génomique en cours.
Séquençage métagénomique est une technologie très puissante car il vise l'ensemble de l'information génétique contenue dans un échantillon environnemental. Il ya différentes saveurs de séquençage métagénomique, y compris le séquençage de fusil de chasse, les bibliothèques de grande insertion et le séquençage de l'amplicon. le séquençage de l'amplicon offre l'avantage d'être relativement peu coûteux, rapide et capable de produire des lectures d'une région génomique unique qui peut être généralement alignée. En outre, le flux de données pour l'analyse de séquençage de l'amplicon a été normalisé. Cependant, puisqu'il est basé sur la PCR, il a tous les biais liés à la spécificité incomplète, couverture incomplète et amorce sollicite 1,2, ce qui rend cette approche semi-quantitative au mieux. Plusieurs régions génomiques peuvent être ciblés pour le séquençage de l'amplicon y compris les gènes fonctionnels, mais les options les plus populaires sont d'utiliser des gènes marqueurs tels que le gène de l'ARNr 16S pour générer un profil de communauté. Traditionnellement, l'ARNr 16S gène amplicon Sequencing a été réalisée en utilisant des techniques à forte intensité de main-d'œuvre qui comprenait le clonage dans E. coli, la cueillette et l'extraction des colonies de plasmide suivie d'un séquençage Sanger sur les plasmides isolés, et, par conséquent, la plupart des études analysé moins de 100 clones par échantillon. Séquençage de nouvelle génération a apporté deux avancées majeures: la parallélisation massive des réactions de séquençage et, surtout, la séparation clonale des modèles sans avoir besoin d'insérer des fragments de gènes dans un hôte. Cela a simplifié considérablement le séquençage d'amplicons du gène ADNr 16S, qui est maintenant de retour en tant que caractéristique courante de nombreuses études de microbiologie de l'environnement, résultant en une «renaissance» pour l'ARNr 16S amplicon du gène séquençage 3.
Depuis l'avènement de Roche 454 séquençage en 2005 4, plusieurs autres technologies de séquençage de nouvelle génération sont apparus sur le marché (par exemple, Illumina, solide, PacBio). Plus récemment, l'introduction de la séquence de paillassers portées à petits laboratoires de la capacité de séquençage fois exclusif de grands centres de séquençage. Cinq machines stationnaires sont actuellement disponibles: la 454 GS Junior Ion Torrent Personal Genome automatique (PGM) et Proton, et l'Illumina MiSeq et NextSeq 500 Bien que toutes ces séquenceurs offrent moins de lectures par cycle et moins de bases pour chaque dollar que la plupart à temps plein séquenceurs d'échelle, ils sont plus souples, rapides, et leurs coûts d'acquisition et d'exploitation à basse rend abordable pour les petits laboratoires universitaires. Séquenceurs de paillasse sont particulièrement bien adaptés pour amplicon, petit génome et à faible complexité séquençage du métagénome dans les études de microbiologie de l'environnement, parce que ce type d'études ne nécessite généralement pas la profondeur extrême de séquençage. Par exemple, il est généralement admis que pour le séquençage du gène 16S ARNr étudie le nombre de lectures par échantillon n'est pas primordiale, comme ~ 1000 la lecture peut générer les mêmes schémas que plusieurs millions de lectures ensembles de données 5. Cela dit, paillasse prochaine generatio n séquenceurs génèrent encore de grandes quantités de données de séquence, avec des rendements maximaux de ~ 35 Mbp (454 GS Junior), ~ 2 Gbp (Ion Torrent PGM), ~ 10-15 Gbp (Ion Torrent Proton), ~ 10 Gbp (Illumina MiSeq) et ~ 100 GBP (Illumina Suivant Seq 500), ce qui est plus que suffisant pour la plupart des études de microbiologie de l'environnement.
Séquençage de nouvelle génération d'amplicons d'ARNr 16S à l'aide de séquenceurs de paillasse a été récemment appliquée à une grande variété d'environnements. Par exemple, la Ion Torrent PGM a été utilisé pour la communauté des analyses de résidus des mines d'uranium qui avaient particulièrement un pH élevé et une faible perméabilité 6, de systèmes de recirculation de l'aquaculture 7, de sols arctiques contaminés par des hydrocarbures 8,9, de sables bitumineux miniers sédiments touchés et biofilms de la rivière Athabasca 10,11, de la rhizosphère de saules plantés dans des sols contaminés 12, des corps humains et animaux 13-16 et de 17 des digesteurs anaérobies.
jove_content "> Dans cette contribution, nous détaillons notre approche de séquençage de l'ARNr 16S amplicons de gènes en interne à l'aide d'une paillasse séquenceur de nouvelle génération (la Ion Torrent PGM). Après extraction de l'ADN, les gènes ARNr 16S sont amplifiés en utilisant des amorces bactériennes au niveau du domaine qui contiennent adaptateurs de séquençage et des séquences uniques, spécifiques à l'échantillon (codes à barres). Les amplicons sont purifiés, quantifiées et regroupées dans un rapport équimolaire. Les échantillons mis en commun puis clonage amplifiés dans une émulsion PCR et séquencés. séquences qui en résultent sont analysés en utilisant la disposition du public des outils de bioinformatique ( par exemple, mothur).1. ARNr 16S Gene Amplicon Bibliothèque préparation par la méthode de fusion
2. Amplicon purification, la quantification et la mise en commun
3 Emulsion PCR et séquençage
Analyse des données de séquence de base 4
Après purification sur gel, avec 25 cycles d'amplification par PCR, les produits d'amplification sont en général à une concentration de 0,2 à 10,0 ng dans 50 ul d'eau. Cela peut varier largement en fonction de la concentration de l'ADN de départ, le type d'échantillon et le kit de purification utilisée. Il est recommandé de maintenir le nombre de cycles de PCR à la plus faible possible pour éviter la formation de chimère et de diminuer les biais d'amplification, en gardant à l'esprit que tous les échantillons doivent être amplifiés en utilisant le même nombre de cycles. Pour réduire le nombre d'anticorps polyclonaux les lectures et les sphères vides et maximiser le nombre de lectures, le rapport de qubits doit être comprise entre 0,1 et 0,3 et la fluorescence de la FAM doit être supérieure à 200 l'aide d'une puce 314 sur un Ion Torrent PGM, le rendement moyen est de l'ordre 0,3-0,5 M de bonne qualité lit après filtrage des résultats en mothur. tableau 2 présente la répartition typique du nombre de lectures après chaque étape de la procédure pour une course contenant 36 environ multiplexééchantillons mentale amplifiés avec des amorces ciblant la région V3-4 des 16S et analysées à l'aide mothur. Dans mothur, la procédure de trim.seqs générer un fichier "* de .trim.fasta" contenant les séquences qui ont passé les filtres de qualité et un "* .scrap.fasta" qui contient les séquences qui ne passe pas les filtres de qualité ainsi que la raison de rejet dans l'en-tête de séquence. Lorsque fourni avec des codes à barres dans le "oligos" fichier, cette commande génère également un fichier "* .Groupes" qui contient l'appartenance au groupe de chaque séquence basée sur la séquence de codes à barres. La procédure de classify.seqs génère un ".tax.summary" qui peut être ouvert dans Excel. Ce fichier contient le résumé de l'affiliation taxonomique (en lignes) pour chacun des échantillons (en colonnes). Ce fichier peut être utilisé pour les analyses statistiques en aval et de visualiser la composition de la communauté à différents niveaux taxonomiques. Le fichier ".taxonomy" contient la taxonomie détailléeaffiliation pour chaque séquence. La composition de la communauté moyenne au niveau phylum / classe dans tous les 36 échantillons est illustré à la figure 1.
Figure 1 composition de la communauté moyenne au niveau phylum / classe dans tous les échantillons.
avant | TACGGRAGGCAGCAG | |
code à barres | CTAAGGTAAC | Sample01 |
code à barres | TAAGGAGAAC | Sample02 |
code à barres | AAGAGGATTC | Sample03 |
code à barres | TACCAAGATC | Sample04 |
code à barres | CAGAAGGAAC | Leçon05 |
code à barres | CTGCAAGTTC | Sample06 |
code à barres | TTCGTGATTC | Leçon07 |
code à barres | TTCCGATAAC | Sample08 |
code à barres | TGAGCGGAAC | Sample09 |
code à barres | CTGACCGAAC | Leçon10 |
Tableau 1 Exemple "oligos" fichier pour une utilisation dans mothur.
Nombre de lit | % De l'étape précédente | Moy. Par exemple | |
Nombre de puits | 1262519 | - | 35070 |
Wells avec des perles | 1114108 | 88.20% | 30947 |
Perles avec des modèles | 1112746 | 99,90% | 30910 |
Perles monoclonaux | 826805 | 74.30% | 22967 |
Bonne qualité lit (sortie du séquenceur) | 782204 | 94.60% | 21728 |
Passe mothur filtres (min. Moy. Score de qualité de 20 sur une fenêtre de 50 points de base, min. Longueur de 150 points de base) | 372168 | 47.60% | 10338 |
Classé au niveau de l'embranchement en GreenGenes (50% seuil de confiance) | 342171 | 91.90% | 9505 |
Classé au niveau de la famille dans GreenGenes (50% seuil de confiance) | 316512 | 92.50% | 8792 |
Classé au niveau du genre dans GreenGenes (50% seuil de confiance) | 289899 | 91.60% | 8053 |
Tableau 2 Nombre de lectures produites à partir d'un essai typique pour 36 échantillons environnementaux multiplexés sur une puce Ion Torrent 314.
La méthode présentée ici est simple et peu coûteux, et devrait permettre à de nombreux laboratoires d'accéder à la puissance de séquençage métagénomique. Bien qu'il varie en fonction de la plate-forme de séquençage utilisée, une fois que les bibliothèques sont construites sont nécessaires très peu de mains sur le temps, avec la plupart des processus étant automatisés. Pour la plate-forme de séquençage utilisée ici (Ion Torrent PGM), la procédure complète peut être effectuée dans les deux jours de travail. Au moment de l'écriture (Septembre 2013), les coûts des réactifs liés à l'exemple détaillé ci-dessus ont été les suivantes: amplification par PCR de 36 échantillons: 25 $, la purification sur gel et PicoGreen ADN quantification de 36 échantillons: 125 $, émulsion PCR pour un échantillon d'amplicon groupé : 150 $ et réactifs de séquençage: 250 $, pour un total de 550 $ ou 15 $ par échantillon ou $ 0,0015 par lecture de qualité filtré. Ce prix ne comprend pas de contrat instrument de service, l'amortissement de l'instrument, technicien salaire et utilisation de l'espace de laboratoire.
tente "> Une des étapes les plus importantes est de mettre en commun tous les produits dans un rapport équimolaire, afin de récupérer le même nombre de lectures pour chacun des échantillons. PicoGreen quantification a été utilisé ici, mais d'autres méthodes pourrait être approprié, bien que moins précise (par exemple, la quantification UV, la quantification à base de gel). Même en faisant la quantification plus précise et la mise en commun, il ya une certaine variabilité dans le nombre de lectures par exemple, et à l'approche typique détaillées au tableau 2, il varie de 4380 à 32750 lit, avec une moyenne de 10 338 lit. Si le traitement grand nombre d'échantillons (plus de 40-50), la purification de gel unique de la colonne peut être remplacée par une purification sur gel en plaque ou de purification en utilisant des billes avec une coupure de taille strictes (par exemple, des perles AMPure) .À ce jour, la technologie de séquençage le plus utilisé de la prochaine génération pour le gène de l'ARNr 16S est 454. Le Ion Torrent technologie de séquençage utilisée dans ce protocole est conceptuellement très similaireà 454 et les deux techniques sont sujettes à la même type d'erreurs de séquençage. Sans surprise, il a été montré que le séquençage Ion Torrent a abouti à des résultats de séquençage très similaires à 454 séquençage 10. Récemment, de nombreux chercheurs ont exploré l'utilisation de la technologie Illumina pour l'ARNr 16S amplicon du gène séquençage 18,19. En tout cas, il serait facile d'adapter le protocole en vigueur pour d'autres séquenceurs de paillasse comme le Illumina MiSeq ou la 454 GS junior en changeant les séquences de fusion des amorces de faire correspondre les cartes et les codes à barres nécessaires à ces technologies de séquençage, comme dans le procédé décrit récemment pour la Illumina MiSeq 19. Alternativement, les chercheurs ont pu suivre les étapes 1 et 2 du protocole détaillé ici et envoyer les amplicons communs à un centre de séquençage où l'émulsion PCR et séquençage seraient effectuées.
Le gène de l'ARNr 16S lectures ont été coupé et classé à l'aide mothur, mais beaucoup d'autres analyses peuvent être effectuées surAmplicons du gène ADNr 16S. Par exemple, la diversité bêta peut être évaluée en calculant les distances entre chaque paire Unifrac de l'échantillon à l'aide de la procédure décrite à http://unifrac.colorado.edu/ 20. Alpha indices de diversité et le nombre d'unités taxonomiques opérationnelles de chaque échantillon peuvent être calculées à l'aide des outils dans QIIME comme AmpliconNoise 21 ou en utilisant la procédure décrite par Huse et al. 22 et disponible dans mothur.
Les amorces utilisées ici amplifiés les régions variables 3 et 4 du gène de l'ARNr 16S, mais beaucoup d'autres régions pourraient être ciblés. Dans cette étude, les gènes de l'ARNr 16S ont été amplifiés à partir de la matière végétale et le choix de l'amorce ont été faits pour éviter l'amplification du gène de l'ARNr 16S du chloroplaste 23,24. Il existe une grande variété d'autres amorces disponibles qui varient selon la durée de la longueur du produit, la puissance et l'utilité taxonomique 25,26. Cependant, dans tous les cas 200-400 pb lit du gène ARNr 16S ne peut pas être fiable classés au niveau de l'espèce, et les analyses sont limitées au genre et les niveaux taxonomiques plus élevés. D'autres gènes pourraient être plus approprié si l'information au niveau des espèces est nécessaire, comme les cpn60 et rpoB gènes 27,28. Une chute brutale à venir dans le coût du séquençage et l'augmentation de la puissance des outils d'analyse pourrait rendre possible de remplacer le séquençage du gène 16S ARNr par métagénomique fusil de chasse, mais en attendant, le séquençage du gène 16S ARNr reste la norme de microbiologie environnementale de l'or.
The authors have nothing to disclose.
Development of the method presented here has been carried out with various sources of funding, including Genome Canada and Genome Quebec, Environment Canada STAGE program and internal NRC funds.
Name | Company | Catalog Number | Comments |
Ion 314 Chip Kit v2 | Life Technologies | 4482261 | |
Ion PGM Sequencing 200 Kit v2 | Life Technologies | 4482006 | |
Ion PGM Template OT2 200 Kit | Life Technologies | 4480974 | |
HotStarTaq Plus Master Mix Kit | Qiagen | 203646 | |
Primers and probes | IDT | NA | |
Qiaquick Gel Extraction Kit | Qiagen | 28704 | |
BSA 20 mg/ml | Roche | 10,711,454,001 | |
Dynabeads MyOne Streptavidin C1 | Life Technologies | 65001 |
Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE
Demande d’autorisationThis article has been published
Video Coming Soon