Method Article
Characterizing microbial community has been a longstanding goal in environmental microbiology. Next-generation sequencing methods now allow for the characterization of microbial communities at an unprecedented depth with minimal cost and labor. We detail here our approach to sequence bacterial 16S ribosomal RNA genes using a benchtop sequencer.
Una de las principales preguntas en ecología microbiana es "quién está allí?" Esta pregunta se puede responder mediante diversas herramientas, pero uno de los de larga duración estándar de oro es para secuenciar los amplificados 16S ribosomal RNA genes (rRNA) generados por el nivel de dominio de PCR reacciones de amplificación a partir de ADN genómico. Tradicionalmente, esto se realizó mediante la clonación y Sanger (electroforesis capilar) la secuenciación de amplicones de PCR. El advenimiento de la secuenciación de próxima generación se ha simplificado enormemente y el aumento de la profundidad de la secuenciación de 16S rRNA secuenciación de genes. La introducción de secuenciadores de sobremesa ahora permite a los pequeños laboratorios para llevar a cabo su secuencia 16S rRNA de la casa en cuestión de días. Aquí, se detalla un método para la secuenciación de ARNr 16S amplicón gen utilizando un secuenciador de sobremesa de próxima generación. El ADN ambiental es primero amplificado por PCR usando cebadores que contienen adaptadores de secuenciación y códigos de barras. A continuación, se acoplan a las partículas esféricas a través de PCR en emulsión. Las partículas son loaded en un chip desechable y el chip se inserta en la máquina de secuenciación después de lo cual se lleva a cabo la secuenciación. Las secuencias se recuperan en formato fastq, se filtraron y los códigos de barras se utilizan para establecer la composición de la muestra de las lecturas. El filtrado y desechado lee a continuación se analizan aún más el uso de herramientas disponibles públicamente. Un análisis ejemplo en el que se lee se clasificaron con un algoritmo de taxonomía de investigación dentro del paquete de software Mothur se da. El método descrito aquí es sencillo, barato y sencillo y debería ayudar a los laboratorios más pequeños para tomar ventaja de la revolución genómica en curso.
Secuenciación metagenómica es una tecnología muy potente, ya que se dirige a la totalidad de la información genética contenida en una muestra ambiental. Hay diferentes sabores de secuenciación metagenómica, incluyendo la secuenciación escopeta, bibliotecas gran insertar y secuenciación de amplificación. Secuenciación del amplicón ofrece la ventaja de ser relativamente barato, rápido y capaz de producir lee de una sola región genómica que puede ser alineada en general. Además, el flujo de trabajo de análisis de datos para la secuenciación del amplicón es principalmente estandarizada. Sin embargo, puesto que se basa en la PCR, que tiene todos los sesgos relacionados con la especificidad incompleta, cobertura incompleta e imprimación desvía 1,2, lo que hace que este método semi-cuantitativo, en el mejor. Varias regiones genómicas pueden ser dirigidos para la secuenciación de amplificación incluyendo genes funcionales, pero las opciones más populares son para utilizar genes marcadores tales como el gen 16S rRNA para generar un perfil de la comunidad. Tradicionalmente, 16S rRNA gen amplicón Sequencing se llevó a cabo utilizando técnicas de trabajo intensivo que incluían la clonación en E. coli, la recolección de la colonia y la extracción del plásmido seguido por secuenciación de Sanger en los plásmidos aislados, y, en consecuencia, la mayoría de los estudios analizados menos de 100 clones por muestra. Secuenciación de próxima generación trajo dos importantes avances: paralelización masiva de las reacciones de secuenciación y, sobre todo, la separación clonal de las plantillas sin la necesidad de insertar fragmentos de genes en un huésped. Esto ha simplificado enormemente la secuenciación del 16S rRNA amplificados del gen, que es ahora de nuevo como una característica habitual de muchos estudios de microbiología ambiental, dando lugar a un "renacimiento" para el 16S rRNA secuenciación de amplificación de genes 3.
Desde el advenimiento de Roche secuencia 454 en 2005 4, varias otras tecnologías de secuenciación de nueva generación han aparecido en el mercado (por ejemplo, iluminación, Sólido, PacBio). Más recientemente, la introducción de la secuencia de sobremesars llevados a pequeños laboratorios la capacidad de secuenciación vez exclusivo de los grandes centros de secuenciación. Cinco máquinas de sobremesa están disponibles en la actualidad: la 454 GS Junior, el Genoma Personal Máquina Ion Torrent (PGM) y protones, y el Illumina MiSeq y NextSeq 500 Si bien todos estos secuenciadores ofrecen menos lee por corrida y menos bases por dólar que la mayoría completo secuenciadores escala, son más rápidas y flexibles y sus bajos costes de adquisición y ejecutar los hace asequibles para los pequeños laboratorios académicos. Secuenciadores de sobremesa están particularmente bien adecuados para amplicón, genoma pequeño y de baja complejidad secuenciación metagenoma en estudios de microbiología ambiental, porque este tipo de estudios generalmente no requiere una profundidad extrema de la secuenciación. Por ejemplo, en general se acordó que para el 16S rRNA secuenciación genética estudia el número de lecturas por muestra no es lo más importante, como ~ 1000 lee puede generar los mismos patrones que varios millones de lecturas de datos 5. Una vez dicho esto, de sobremesa de próxima generatio n secuenciadores siguen generando grandes cantidades de datos de secuencias, con rendimientos máximos de ~ 35 Mbps (454 GS Junior), ~ 2 libras esterlinas (Ion Torrent PGM), ~ 15.10 GBP (Ion Torrent de protones), ~ 10 GBP (Illumina MiSeq) y ~ 100 GBP (Illumina Siguiente Sec 500), que es más que suficiente para la mayoría de los estudios de microbiología ambiental.
Secuenciación de próxima generación de amplicones 16S rRNA utilizando secuenciadores de sobremesa se ha aplicado recientemente a una amplia variedad de entornos. Por ejemplo, el Ion Torrent PGM se ha utilizado para los análisis de la comunidad de relaves de las minas de uranio que tenían especialmente alto pH y baja permeabilidad 6, de sistemas de recirculación de la acuicultura 7, de suelos contaminados con hidrocarburos del Ártico 8,9, de minería de arenas petrolíferas sedimentos afectados y biofilms del río Athabasca 10,11, de la rizosfera de sauces plantados en suelos contaminados 12, de los cuerpos humanos y animales 13-16 y de 17 digestores anaerobios.
jove_content "> En esta contribución se detalla nuestro enfoque para secuenciar 16S rRNA genes amplificados en casa usando un secuenciador de sobremesa de última generación (el Ion Torrent PGM). Después de la extracción de ADN, los genes 16S rRNA se amplificó utilizando cebadores bacterianos de nivel de dominio que contienen adaptadores de secuenciación y secuencias únicas, específicos de la muestra (códigos de barras). Los amplicones se purifican, cuantifican y se agruparon en una relación equimolar. Las muestras combinadas son entonces amplificados por clonación en una emulsión PCR y secuenciados. secuencias resultantes se analizaron usando herramientas bioinformáticas disponibles públicamente ( por ejemplo, Mothur).1. 16S rRNA gen Amplicon Biblioteca Preparación por el método de fusión
2. Amplicon Purificación, cuantificación y Pooling
3. Emulsión PCR y secuenciación
Análisis 4. Básica Datos de Secuencia
Después de la purificación en gel, con 25 ciclos de amplificación por PCR, los productos de amplificación son por lo general a una concentración de 0,2-10,0 ng en 50 l de agua. Esto puede variar ampliamente dependiendo de la concentración de ADN de partida, el tipo de muestra y el kit de purificación utilizado. Se recomienda mantener el número de ciclos de PCR a la más baja posible para evitar la formación de quimeras y disminuir los sesgos de amplificación, teniendo en cuenta que todas las muestras deben ser amplificados usando el mismo número de ciclos. Para minimizar el número de anticuerpos policlonales lee y esferas vacías y maximizar el número de lecturas, la relación Qubit debe estar entre 0,1 y 0,3 y la fluorescencia FAM debe estar por encima de 200 Usando un chip 314 en una Ion Torrent PGM, la salida promedio es de alrededor 0,3-0,5 buena calidad M lee después de la filtración de los resultados en Mothur. Tabla 2 muestra una composición típica del número de lecturas después de cada paso del procedimiento para una carrera que contiene 36 environ multiplexadamuestras mentales amplificados con primers objetivo la región V3-4 de los 16S y analizados utilizando Mothur. En Mothur, el procedimiento trim.seqs generar un archivo "* .trim.fasta" que contiene las secuencias que han pasado los filtros de calidad y un "* .scrap.fasta" que contiene las secuencias que no pasó los filtros de calidad junto con la razón para el rechazo en el encabezamiento de secuencia. Cuando se suministra con los códigos de barras en el archivo "oligos", este comando también generará un archivo "* .Grupos" que contiene la pertenencia al grupo de cada secuencia basada en la secuencia de código de barras. El procedimiento classify.seqs genera un ".tax.summary" que se puede abrir en Excel. Este archivo contiene el resumen de la afiliación taxonómica (en líneas) para cada una de las muestras (en columnas). Este archivo puede ser utilizado para los análisis estadísticos posteriores y para visualizar la composición de la comunidad en los distintos niveles taxonómicos. El archivo ".taxonomy" contiene la taxonomía detalladaafiliación para cada secuencia. La composición media de la comunidad a nivel phylum / clase a través de los 36 muestras se muestra en la Figura 1.
Figura 1. Composición media comunitaria a nivel phylum / clase en todas las muestras.
adelante | TACGGRAGGCAGCAG | |
código de barras | CTAAGGTAAC | SAMPLE01 |
código de barras | TAAGGAGAAC | Sample02 |
código de barras | AAGAGGATTC | Sample03 |
código de barras | TACCAAGATC | Sample04 |
código de barras | CAGAAGGAAC | Sample05 |
código de barras | CTGCAAGTTC | Sample06 |
código de barras | TTCGTGATTC | Sample07 |
código de barras | TTCCGATAAC | Sample08 |
código de barras | TGAGCGGAAC | Sample09 |
código de barras | CTGACCGAAC | Ejemplo10 |
Tabla 1 Ejemplo de archivo "oligos" para su uso en Mothur.
# De lecturas | % De la etapa anterior | Media. por muestra | |
Número de pozos | 1262519 | - | 35070 |
Wells con cuentas | 1114108 | 88.20% | 30947 |
Cuentas con plantillas | 1112746 | 99,90% | 30910 |
Perlas monoclonales | 826805 | 74.30% | 22967 |
Buena calidad lee (Salida desde el secuenciador) | 782204 | 94.60% | 21728 |
Pass Mothur filtros (min. Promedio. Puntuación de calidad de 20 sobre una ventana de 50 puntos básicos, min. Longitud de 150 pb) | 372168 | 47.60% | 10338 |
Clasificado en el nivel phylum en Greengenes (50% umbral de confianza) | 342171 | 91.90% | 9505 |
Clasificada en el ámbito familiar en Greengenes (50% umbral de confianza) | 316512 | 92.50% | 8792 |
Clasificado a nivel de género en Greengenes (50% umbral de confianza) | 289899 | 91.60% | 8053 |
Cuadro 2 Número de lecturas producido a partir de una serie típica de 36 muestras ambientales multiplexados en un chip de 314 Ion Torrent.
El método que aquí se presenta es sencillo y barato, y debería permitir que muchos laboratorios para acceder al poder de secuenciación metagenómica. Aunque varía dependiendo de la plataforma de secuenciación utilizado, una vez que las bibliotecas se construyen se requiere muy poca práctica en el tiempo, con la mayor parte del proceso que se está automatizado. Para la plataforma de secuenciación utilizada aquí (Ion Torrent PGM), el procedimiento completo se puede realizar dentro de los dos días de trabajo. En el momento de escribir (septiembre de 2013), los costes de reactivos relacionados con el ejemplo detallado anteriormente eran como sigue: PCR de amplificación de 36 muestras: 25 dólares, purificación en gel y el ADN PicoGreen cuantificación de 36 muestras: $ 125, emulsión PCR para una muestra conjunta amplicón : $ 150 y reactivos de secuenciación: $ 250, para un total de $ 550 o $ 15 por muestra o $ 0,0015 por la calidad de lectura-filtrada. Este precio no incluye el instrumento de contrato de servicios, la depreciación de instrumentos, técnico de salario y el uso de espacio de laboratorio.
tienda "> Uno de los pasos más importantes es poner en común todos los productos en una relación equimolar, con el fin de recuperar número similar de lecturas para cada una de las muestras. PicoGreen cuantificación se utiliza aquí, pero otros métodos podría ser adecuado, aunque menos preciso (por ejemplo, la cuantificación UV, la cuantificación basada en gel). Incluso, al hacer la cuantificación más precisa y puesta en común, existe cierta variabilidad en el número de lecturas por muestra, y en el ensayo normal se detalla en la Tabla 2, que varía de 4.380 a 32.750 lee, con un promedio de 10 338 lee. Si el procesamiento de gran número de muestras (más de 40-50), purificación en gel de una sola columna puede ser reemplazado por purificación en gel en placa o purificación usando perlas con un corte de tamaño estrictas (por ejemplo, perlas AMPure) .Hasta la fecha, la tecnología de secuenciación de próxima generación más utilizado para el gen 16S rRNA es 454. tecnología de secuenciación El Ion Torrent utilizada en este protocolo es conceptualmente muy similara 454 y ambas tecnologías son propensos al mismo tipo de errores de secuenciación. No es sorprendente, se demostró que Ion Torrent secuenciación dio lugar a resultados de la secuenciación muy similares a la secuencia 454 10. Recientemente, muchos investigadores han explorado el uso de la tecnología de iluminación para la secuenciación de ARNr 16S amplicón gen 18,19. En cualquier caso, sería fácil de adaptar el protocolo actual para otros secuenciadores de sobremesa como el Illumina MiSeq o la GS 454 junior cambiando las secuencias de los cebadores de fusión para que coincida con los adaptadores y códigos de barras necesarios para estas tecnologías de secuenciación, como en el método descrito recientemente para el Illumina MiSeq 19. Alternativamente, los investigadores podrían seguir los pasos 1 y 2 del protocolo detallado aquí y enviar los amplicones agrupados a un centro de secuenciación, donde se realizarían la emulsión PCR y secuenciación.
El gen ARNr 16S se lee recortado y clasificado utilizando Mothur, pero muchos otros análisis se puede realizar en16S rRNA genes amplicones. Por ejemplo, la diversidad beta se puede evaluar mediante el cálculo de las distancias entre cada par UniFrac muestra utilizando el procedimiento descrito en http://unifrac.colorado.edu/ 20. Alpha índices de diversidad y número de unidades operativas taxonómicas de cada muestra se pueden calcular utilizando herramientas dentro QIIME como AmpliconNoise 21 o usando el procedimiento descrito por Huse et al. 22 y disponible dentro Mothur.
Los cebadores utilizados aquí amplifican las regiones variables 3 y 4 del gen 16S rRNA, pero muchas otras regiones podrían dirigirse. En este estudio, los genes 16S rRNA fueron amplificados de material vegetal y se hizo la elección de imprimación para evitar la amplificación del gen 16S rRNA cloroplasto 23,24. Hay una amplia variedad de otros cebadores disponibles que varían en términos de la longitud del producto, el poder y la utilidad taxonómica 25,26. Sin embargo, en todos los casos 200-400 pb lee del gen 16S rRNA no puede ser clasificado de forma fiable a nivel de especie, y los análisis se limitan al género y los niveles taxonómicos superiores. Otros genes podrían ser más adecuado si se necesita información a nivel de especie, al igual que los genes rpoB y CPN60 27,28. Caídas drásticas futuros en el costo de la secuenciación y el aumento de la potencia de las herramientas de análisis pueden hacer factible para reemplazar 16S rRNA gen secuenciación metagenómica por escopeta, pero hasta entonces 16S rRNA secuenciación de genes sigue siendo el estándar de oro de la microbiología ambiental.
The authors have nothing to disclose.
Development of the method presented here has been carried out with various sources of funding, including Genome Canada and Genome Quebec, Environment Canada STAGE program and internal NRC funds.
Name | Company | Catalog Number | Comments |
Ion 314 Chip Kit v2 | Life Technologies | 4482261 | |
Ion PGM Sequencing 200 Kit v2 | Life Technologies | 4482006 | |
Ion PGM Template OT2 200 Kit | Life Technologies | 4480974 | |
HotStarTaq Plus Master Mix Kit | Qiagen | 203646 | |
Primers and probes | IDT | NA | |
Qiaquick Gel Extraction Kit | Qiagen | 28704 | |
BSA 20 mg/ml | Roche | 10,711,454,001 | |
Dynabeads MyOne Streptavidin C1 | Life Technologies | 65001 |
Solicitar permiso para reutilizar el texto o las figuras de este JoVE artículos
Solicitar permisoThis article has been published
Video Coming Soon
ACERCA DE JoVE
Copyright © 2025 MyJoVE Corporation. Todos los derechos reservados