Method Article
This protocol describes a rapid and broadly applicable method for unbiased RNA-sequencing of viral samples from human clinical isolates.
Nous présentons ici un ARN protocole de séquençage de nouvelle génération qui permet de novo assemblées et intra-hôte variants appels de génomes viraux recueillies à partir de sources cliniques et biologiques. La méthode est impartiale et universelle; il utilise des amorces aléatoires pour la synthèse d'ADNc et ne nécessite aucune connaissance préalable du contenu de la séquence virale. Avant la construction de la banque, la digestion sélective à base de RNase H est utilisée pour appauvrir l'ARN non désiré - y compris le poly (rA) porteuse et l'ARN ribosomal - à partir de l'échantillon d'ARN viral. déplétion sélective améliore à la fois la qualité des données et le nombre de lit unique, dans des bibliothèques virales de séquençage de l'ARN. En outre, l'étape a 'tagmentation' à base de transposase est utilisée dans le protocole, car il réduit le temps global de la construction de la bibliothèque. Le protocole a permis le séquençage rapide et profonde de plus de 600 échantillons, y compris le virus Lassa et Ebola collections de sang et de tissus isolats et est largement applicable à d'autres études de génomique microbienne.
séquençage de la prochaine génération de virus à partir de sources cliniques peut informer la transmission et l'épidémiologie des infections, ainsi que le soutien de l'aide nouvelle de diagnostic, les vaccins et le développement thérapeutique. synthèse d'ADNc en utilisant des amorces aléatoires a permis la détection et l' assemblage des génomes de divergent, co-infectant ou même de nouveaux virus 1,2. Comme avec d'autres méthodes impartiales, contaminants indésirables occupent beaucoup séquençage lit et un impact négatif sur les résultats de séquençage. Hôte et poly (rA) ARN porteur sont des contaminants présents dans de nombreuses collections virales existantes de l'échantillon.
Le protocole décrit un moyen efficace et rentable de profondes génomes de virus à ARN de séquençage basé sur l'ARN-seq impartiale totale. Le procédé utilise une RNase H déplétion sélective étape 3 pour supprimer ribosomal hôte indésirable et de l' ARN porteur. Déplétion sélective enrichit pour le contenu viral (figure 1) et améliore la qualité globale des données de séquençage(Figure 2) à partir d' échantillons cliniques. En outre, tagmentation est appliqué le protocole, car elle réduit considérablement le temps de construction de bibliothèques. Ces méthodes ont été utilisées pour générer rapidement de grands ensembles de données d'Ebola et Lassa virus génomes 2,4,5 et peuvent être utilisés pour étudier un large éventail de virus à ARN. Enfin, l'approche ne se limite pas à des échantillons humains; l'utilité de l' épuisement sélectif a été démontrée sur des échantillons de tissus prélevés à partir des rongeurs infectés par Lassa et des modèles de maladies de primate non humain 5,6.
Figure 1. L' ARN total du contenu Reflète Enrichissement de Lassa Virus Content Utilisation sélective Épuisement. À partir du contenu global (entrée d'ARN) et l' enrichissement des virus Lassa uniques (LASV) lit (contenu de la bibliothèque) sur ARNr déplétion de neuf isolats cliniques différents. Ce chiffre a été modifié depuis 6 . S'il vous plaît cliquer ici pour voir une version plus grande de cette figure.
Figure 2. Qualité supérieure Séquençage Après l' ARN transporteur Épuisement. Les qualités médians de base par cycle de séquençage de poly (rA) bibliothèques de virus contaminés au Lassa (rouge) et le contrôle (aucun transporteur observé dans la bibliothèque, noir) du QC rapport 13. Les deux lu 1 et lu 2 de fin appariés lectures sont fusionnés dans le fichier de BAM de la bibliothèque et les scores de qualité sont présentés à chaque base. Ce chiffre a été modifié depuis 6. S'il vous plaît cliquez ici pour voir une version plus grande de cette figure.
Le détails du protocole construction de bibliothèques d'ARN-seq virale directement à partir extraitL'ARN collecté à partir d'échantillons cliniques et biologiques. Pour assurer la sécurité personnelle, tous les échantillons viraux sérum, le plasma et les tissus doivent être inactivés dans des tampons appropriés avant l'extraction de l'ARN. Dans certains kits d'inactivation et d'extraction, le transporteur poly (rA) ARN est inclus; ce sera supprimée au cours de la RNase H étape initiale de déplétion sélective. Sur la base de la récupération complète, la concentration attendue de l'ARN porteur est de 100 ng / pl. Dans le protocole, 110 ng / ul oligo dT ARN (concentration de porteurs de 1,1x) est utilisé pour l'épuisement. Si le poly (rA) porteur ne sont pas présents dans l'échantillon, puis l'oligo (dT) ne doit pas être ajouté avant l'épuisement.
Le protocole suivant a été conçu pour 24 réactions dans le format de plaque PCR (jusqu'à un volume de 250 ul). Une version antérieure de ce protocole a été rapporté dans Matranga, et al. 6.
déclaration éthique: les patients atteints de fièvre de Lassa ont été recrutés pour cette étude en utilisant des protocoles approuvés par les comités de sujets humains à l'Université Tulane, l'Université de Harvard, Broad Institute, Irrua Spécialiste CHU (ISTH), Hôpital gouvernement Kenema (HGK), l'Etat d'Oyo Ministère de la Santé, Ibadan , le Nigeria et la Sierra Leone Ministère de la Santé. Tous les patients ont été traités avec une norme de soins similaires et ont été offerts le médicament Ribavirin, si oui ou non ils ont décidé de participer à l'étude. Pour la fièvre Lassa (LF) patients, le traitement par Ribavirine a suivi les lignes directrices recommandées actuellement et a été généralement offerte dès LF a été fortement suspectée.
En raison de la grave épidémie d'Ebola virus de la maladie (EVD), les patients ne pouvaient pas être consenti par nos protocoles standards. Au lieu d'utiliser des échantillons cliniques en excès provenant de patients EVD a été évalué et approuvé par Institutional Review Board en Sierra Leone et à l'Université de Harvard. Le OffiBureau du Comité Sierra Leone éthique et d'examen scientifique, le Leone Ministère Sierra de la Santé et de l'assainissement, et le Comité de Harvard sur l'utilisation des sujets humains ont accordé une dispense du consentement à la séquence et de faire des séquences virales publiquement disponibles obtenues à partir d'échantillons de patients et de contact recueillies au cours de l'épidémie d'Ebola en Sierra Leone. Ces organes ont également l'autorisation d'utiliser les données cliniques et épidémiologiques pour les échantillons anonymisées recueillies auprès de tous les patients EVD suspects recevant des soins au cours de la réponse aux épidémies. La Sierra Leone Ministère de la Santé et de l'assainissement a également approuvé les envois d'échantillons non infectieux, non-biologiques de la Sierra Leone au Broad Institute et de l'Université de Harvard pour les études génomiques d'échantillons d'épidémie.
1. DNase-traitement de l'ARN de l'échantillon (jusqu'à 55 pi Extrait ARN total, ~ 4 h)
2. déplétion sélective des ribosomique et Carrier ARN à partir d'ARN viral Sample (~ 4 h)
3. Synthèse d'ADNc (~ 6 h)
4. Bibliothèque Préparation - Bibliothèque ADN Construction (~ 4 h)
Figure 3. Les bibliothèques construites à partir d' Ebola Virus échantillons cliniques. Image Gel de 4 représentant le virus Ebola (EBOV) bibliothèques. Régions de bibliothèque et d' amorces dimères sont présentés. S'il vous plaît cliquer ici pour voir une version plus grande de cette figure.
Le protocole décrit permet la génération de séquençage de haute qualité se lit de bas-entrée des échantillons d'ARN viral tout en enrichissant pour le contenu viral unique. Comme on le voit sur la figure 1, le protocole a enrichi le contenu unique du virus Lassa au moins cinq fois dans tous les échantillons ( par rapport aux témoins non appauvrie) avec au moins un million de copies d'ARNr 18S (~ 100 pg d'ARN total). De même, le succès de séquençage également en corrélation avec la quantité de virus dans un échantillon donné. QRT-PCR en utilisant comme substitut pour la quantité virale, des échantillons qui contenaient ~ 1000 ou plus virales copies du génome le plus souvent créé des ensembles complets (données non présentées). Par ailleurs, l' épuisement du poly (rA) porteuse réduit les séquences d'homopolymère de A et T dans les bibliothèques, ce qui entraîne des préparations plus propres et d' assurer une meilleure qualité de séquençage de lectures (figure 2). bibliothèques finales de faible entrée des échantillons cliniques viraux ont souvent une large longueur des fragments de 150 à 1000 pb(Figure 3).
Après le séquençage, pour réduire misidentification de l' échantillon et la diaphonie entre les bibliothèques dans un pool 12, seul indice lit avec un score de qualité de base de 25 (q25) et veiller à zéro inadéquations sont conservés pendant le processus de démultiplexage. Les génomes viraux sont assemblés à l' aide d' un pipeline de bio - informatique spécifique pour les virus divergentes 2,4-6. Ces outils sont disponibles à https://github.com/broadinstitute/viral-ngs ou par le biais des plates - formes de cloud commerciales 4.
Etape 1.1: réaction de DNase | |
Réactif | Volume par réaction (ul) |
tampon 10x DNase | 7 |
l'eau exempte de nucléase | 6 |
ARN viral Extrait | 55 |
DNase (2 U / & #181; l) | 2 |
Volume total | 70 |
Etape 2.1: tampon 5x Hybridation | |
Réactif | Volume pour 1 ml (pi) |
5 M de NaCl | 200 |
1 M de Tris-HCl (pH 7,4) | 500 |
l'eau exempte de nucléase | 300 |
Volume total | 1000 |
Etape 2.1: 10x tampon de réaction RNase H | |
Réactif | Volume pour 1 ml (pi) |
5 M de NaCl | 200 |
1 M de Tris-HCl (pH 7,5) | 500 |
1 M de MgCl2 | 200 |
l'eau exempte de nucléase | 500 |
Volume total | 1000 |
Etape 2.1: L' eau wacrylamide linéaire ith | |
Réactif | Volume 1 ml de tampon (ul) |
l'eau exempte de nucléase | 992 |
acrylamide linéaire (5 mg / ml) | 8 |
Volume total | 1000 |
Etape 2.2: réaction d'hybridation pour déplétion sélective | |
Réactif | Volume par réaction (ul) |
5x Hybridization Buffer | 2 |
ARNr épuisement oligo- mélange (100 pM) | 1.22 |
Oligo (d) T (550 ng / ul) | 1 |
DNase traité l'ARN total | jusqu'à 5 |
De Spike en ARN (Cette option est facultative) | 0,5 |
Eau (avec linéaire acrylamide) | mettre à 10 au total |
volu totalmoi | dix |
Etape 2.3: RNase H réaction pour déplétion sélective | |
Réactif | Volume par réaction (ul) |
10x RNase H Tampon de réaction | 2 |
Eau (avec linéaire acrylamide) | 5 |
Thermostable RNase H (5 U / pl) | 3 |
Volume total | dix |
Etape 2.4: DNase post-réaction déplétion sélective | |
Réactif | Volume par réaction (ul) |
10x DNase Buffer | 7.5 |
Eau (avec linéaire acrylamide) | 44,5 |
inhibiteur de RNase (20 U / ul) | 1 |
DNase RNase-I (2,72 U / ul) | 2 |
Le volume total (avec la RNase H de réaction) | 75 |
Etape 3.1: synthèse d'ADNc, amorce aléatoire hybridation | |
Réactif | Volume par réaction (ul) |
rRNA / ARN porteur appauvri | dix |
3 pg d'amorce aléatoire | 1 |
Volume total | 11 |
Etape 3.2: Premier volet réaction de synthèse d'ADNc | |
Réactif | Volume (ul) |
5x First-Strand Reaction Buffer | 4 |
0,1 M DTT | 2 |
10 mM dNTP mix | 1 |
inhibiteur de RNase (20 U / ul) | 1 |
La transcriptase inverse (ajoutez dernier) | 1 |
Le volume total (avec de l'ARN ci-dessus) | 20 |
Etape 3.3: Deuxième volet réaction de synthèse d'ADNc | |
Réactif | Volume (ul) |
l'eau sans RNase | 43 |
10x Reaction Buffer Second-Strand | 8 |
10 mM dNTP mix | 3 |
E. Coli DNA Ligase (10 U / pl) | 1 |
E. coli DNA polymerase I (10 U / pl) | 4 |
Coli RNase H (2 U / pl) | 1 |
Le volume total (avec 1 er réaction de brin) | 80 |
Etape 4.2: réaction de Tagmentation | |
Réactif | Volume (ul) |
Amplicon Tagment Mix (ATM) | 1 |
Tampon ADN Tagment (TD) | 5 |
Le volume total (avec de l'ADNc) | dix |
Etape 4.3: réaction Library PCR | |
Réactif | Volume (ul) |
PCR Master Mix (NPM) | 7.5 |
Indice 1 amorce (i7) | 2.5 |
Indice 2 amorce (i5) | 2.5 |
Le volume total (avec tagmented ADNc) | 25 |
Étape 4.3.2: Les conditions de PCR Bibliothèque | |
72 ° C 3 min | |
95 ° C, 30 sec | |
jusqu'à 18 cycles-10 sec à 95 ° C, 30 s à 55 ° C, 30 s à 72 ° C | |
72 ° C, 5 min | |
10 ° C, pour toujours |
Tableau 1:. Réaction mise en place et les tampons étape par étape des tables avec des contenus de tous les tampons et les mélanges de réaction.
Tableau 2: qRT-PCR Amorces Sequences __gVirt_NP_NNS_NNPS<__ Amorces utilisées pour la mesure de l' hôte (18S) et virales (Ebola et Lassa) contenu.. 'KGH' Hospital Gouvernement Kenema en Sierra Leone, où les amorces d' Ebola ont été testés 2. 'Kulesh' est le chercheur qui a conçu le jeu d' amorces 14.
Tableau 3: ARN ribosomique (ARNr) Épuisement oligos 195 50 nucléotidiques de longues séquences complémentaires à l' ARNr humaine pour déplétion sélective étape 6.. S'il vous plaît cliquer ici pour télécharger ce fichier.
Oligo Nom | Séquence (5 'à 3') |
Ebola KGH FW | GTCGTTCCAACAATCGAGCG |
Ebola KGH RV | CGTCCCGTAGCTTTRGCCAT |
Ebola kulesh FW | TCTGACATGGATTACCACAAGATC |
Ebola kulesh RV | GGATGACTCTTTGCCGAACAATC |
Lassa SL FW | GTA AGC CCA GCD GYA AAB CC |
Lassa SL RV | AAG CCA CAG AAA RCT GGS AGC A |
18S FW | TCCTTTAACGAGGATCCATTGG |
18S RV | CGAGCTTTTTAACTGCAGCAACT |
L'approche décrite permet robuste, universel, séquençage rapide et a été utilisé pour le séquençage du virus Ebola au cours de la 2,4 2014 épidémie. Par couplage d'appauvrissement sélectif et la synthèse d'ADNc avec la construction de la bibliothèque de tagmentation, le temps de traitement global a été réduit par ~ 2 jours à partir des procédés de ligature adaptateur précédentes. Plus récemment, ce protocole a été employé par des collaborateurs internationaux et d' autres avec un grand succès 15,16 et sera déployé à des laboratoires en Afrique de l' Ouest pour soutenir les études et diagnostics 17 locales fondées sur la génomique recherche.
Le protocole décrit ici utilise des amorces aléatoires pour préparer l'ADNc pour les bibliothèques d'ARN-seq virales. Contrairement aux approches virales précédentes d'ARN-seq, il ne nécessite pas une connaissance a priori des données de séquence ou la conception d'amorce complexe et prend du temps pour un virus ou clade spécifique. Le procédé peut être appliqué à un échantillon d'ARN viral. Par exemple, il a été utilisé pour générer du contenu viral à la fois Ebolaet des échantillons de Lassa 6. Le protocole peut également être utilisé pour transcriptomique hôte, les projets de séquençage métagénomique et de découverte de l' agent pathogène 1.
Une étape critique du protocole est ciblé RNase H digestion, un haut-débit, méthode peu coûteuse pour éliminer porteuse parasite et de l'ARN hôte à partir d'échantillons viraux. L'étape de déplétion sélective du protocole utilise de nombreux composants et nécessite des compétences et de précision. temps et précautions supplémentaires doivent être prises lors de la configuration initiale.
Comme la plupart des échantillons de sérum et de plasma cliniques ont souvent très peu de matériel d'acide nucléique, la contamination et la perte de l'échantillon sont communs. Pour éviter ces problèmes, une attention particulière doit être prise lors de l'utilisation de ce protocole. Tout d'abord, l'ARN est très sensible à la dégradation; donc tous les domaines doivent être propres et exempts de nucléases. Deuxièmement, pour identifier les échantillons appropriés pour une utilisation dans ce protocole, les essais qRT-PCR pour l'ARN hôte et le virus devraient être utilisés pour la quantification 5,6 . Lorsque l'on compare l' entrée revient avec des résultats de séquençage du protocole, le succès de séquençage (c. -à- génération de données suffisantes pour l' assemblage viral complet) en corrélation avec les échantillons qui contenaient au moins 100 pg d' ARN total et 1.000 copies du virus. En troisième lieu, l'exposition à des sources d'acides nucléiques de l'environnement doit être évité. Le protocole décrit ici est fait dans une enceinte de sécurité biologique pour les précautions de sécurité et pour limiter les contaminants environnementaux. De plus, notre groupe et d' autres ont remarqué que les enzymes commerciales peuvent être une autre source d'acides nucléiques contaminants bactériens dans des échantillons d'entrée à basse 6,18. Utilisation d'un espace de travail propre (par exemple, hotte PCR, enceinte de sécurité biologique) et des contrôles négatifs (par exemple, l' eau ou du tampon) contribueront à atténuer et de suivre la contamination, respectivement. Pour les échantillons avec <100 pg d'ARN total, seul poly (rA) ARN porteur, non ARNr, devrait être épuisé pour garantir des résultats de séquençage de haute qualité tout en limitant la perte de matériel. Pour les trèsdes échantillons d'entrée faible, les méthodes d'amplification d' ADNc peut être plus approprié 19, bien que le poly (rA) support doit être éliminé avant la synthèse de l' ADNc.
L'épuisement de l' hôte ARNr pour enrichir le contenu viral dans les bibliothèques de séquençage et est applicable à la collecte d'échantillons différents , y compris le sérum ou le plasma, et de multiples types de tissus prélevés sur des rongeurs et des primates non humains 5,6. Dans les organismes non humains, les lectures alignant sur 28S est resté après l' épuisement, ce qui suggère 28S est moins conservée entre les humains et les autres espèces de 6,20. Lors de l' utilisation de cette méthode avec les isolats non humains, il peut être nécessaire de compléter avec des oligos d'ADN complémentaires aux séquences d' ARNr divergentes de la 3,21 hôte spécifique.
Étant donné que le protocole est impartiale, virale lit peut représenter seulement une petite fraction du contenu de la bibliothèque totale. Bien que l'ARNr est l'espèce la plus abondante de l'ARN hôte et seul un faible pourcentage des ARNr lit (0; 1%) se trouvent après l' épuisement sélectif, tous les autres ARN hôte (par exemple, ARNm) restera après l' épuisement et peut expliquer beaucoup de séquençage lit à partir de l'échantillon. Par conséquent , «suréchantillonnage» (c. -à- oversequencing) bibliothèques individuelles est nécessaire afin d'avoir une couverture suffisante pour montage et variantes appels viraux. Pour nos études, nous essayons de séquence ~ 20 millions lit par échantillon pour avoir assez de profondeur pour l' analyse des variantes génomiques et associée virale ainsi que le contenu métagénomique 2,5. Pour les études de découverte metagénomiques et d'agents pathogènes, il est important de noter que la contamination de l'ADN de l'hôte est éliminée par digestion par la DNase. Par conséquent, les virus et autres agents pathogènes qui contiennent des génomes d'ADN peuvent être perdues au cours du procédé, cependant intermédiaires d'ARN peuvent encore être séquencées.
The authors have no competing financial interests.
This work has been funded in part with Federal funds from the National Institutes of Health, Office of Director, Innovator (No.: DP2OD06514) (PCS) and from the National Institute of Allergy and Infectious Diseases, National Institutes of Health, Department of Health and Human Services, under Contracts (No:HHSN272200900018C, HHSN272200900049C and U19AI110818).
Name | Company | Catalog Number | Comments |
96-well PCR Plates | VWR | 47743-953 | |
Strips of Eight Caps | VWR | 47745-512 | |
Nuclease-free water | Ambion | AM9937 | 50 ml bottle |
TURBO DNase | Ambion | AM2238 | post RNA extraction step, 2 U/µl, buffer included |
PCR cycler | any PCR cyclers | ||
Agencourt RNAClean XP SPRI beads | Beckman Coulter Genomics | A63987 | beads for RNA cleanup |
Real Time qPCR system | any system | ||
DynaMag-96 Side Skirted Magnet | Invitrogen | 12027 | |
70% Ethanol | prepare fresh | ||
qRT-PCR primers | IDT DNA | see Table 2 | |
5 M NaCl | Ambion | AM9760G | |
1 M Tris-HCl pH 7.4 | Sigma | T2663-1L | |
1 M Tris-HCl pH 7.5 | Invitrogen | 15567-027 | |
1 M MgCl2 | Ambion | AM9530G | |
Linear acrylamide | Ambion | AM9520 | |
DNA oligos covering entire rRNA region | IDT DNA | see Table 3, order lab-ready at 100 µM | |
Oligo (dT) | IDT DNA | 40 nt long, desalted | |
Hybridase Thermostable RNase H | Epicentre | H39100 | |
RNase-free DNase Kit | Qiagen | 79254 | post selective depletion step |
SUPERase-In RNase Inhibitor | Ambion | AM2694 | |
Random Primers | Invitrogen | 48190-011 | mostly hexamers |
10 mM dNTP mix | New England Biolabs | N0447L | |
SuperScript III Reverse Transcriptase | Invitrogen | 18080-093 | with first-strand buffer, DTT |
Air Incubator | any air incubator cyclers | ||
NEBNext Second Strand Synthesis (dNTP-free) Reaction Buffer | New England Biolabs | B6117S | 10x |
E. coli DNA Ligase | New England Biolabs | M0205L | 10 U/μl |
E. coli DNA Polymerase I | New England Biolabs | M0209L | 10 U/μl |
E. coli RNase H | New England Biolabs | M0297L | 2 U/μl |
0.5 M EDTA | Ambion | AM9261 | |
Agencourt AMPure XP SPRI beads | Beckman Coulter Genomics | A63881 | beads for DNA cleanup |
Elution Buffer | Qiagen | 10 mM Tris HCl, pH 8.5 | |
Quant-iT dsDNA HS Assay Kit | Invitrogen | Q32854 | |
Qubit fluorometer | Invitrogen | Q32857 | |
Nextera XT DNA Sample Prep Kit | Illumina | FC-131-1096 | |
Nextera XT DNA Index Kit | Illumina | FC-131-1001 | |
Tapestation 2200 | Agilent | G2965AA | |
High Sensitivity D1000 reagents | Agilent | 5067-5585 | |
High Sensitivity D1000 ScreenTape | Agilent | 5067-5584 | |
BioAnalyzer 2100 | Agilent | G2939AA | |
High Sensitivity DNA reagents | Agilent | 5067-4626 | |
Library Quantification Complete kit (Universal) | Kapa Biosystems | KK4824 | alternative to tapestation, bioanalyzer for library quantification |
Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE
Demande d’autorisationThis article has been published
Video Coming Soon