Un abonnement à JoVE est nécessaire pour voir ce contenu. Connectez-vous ou commencez votre essai gratuit.
Method Article
Ici, nous décrivons un protocole détaillé pour une méthode de séquençage basée sur la LC-MS qui peut être utilisée comme méthode directe pour séquencer l’ARN court (<35 nt par exécution) sans intermédiaire d’ADNc, et comme méthode générale pour séquencer différentes modifications nucléotidiques dans une seule étude avec une précision de base unique.
Les approches de séquençage basées sur la spectrométrie de masse (MS) se sont révélées utiles pour le séquençage direct de l’ARN sans avoir besoin d’un intermédiaire d’ADN complémentaire (ADNc). Cependant, de telles approches sont rarement appliquées comme méthode de séquençage de novo de l’ARN, mais utilisées principalement comme un outil pouvant aider à l’assurance de la qualité pour confirmer les séquences connues d’échantillons d’ARN simple brin purifiés. Récemment, nous avons développé une méthode de séquençage direct de l’ARN en intégrant une stratégie de marquage hydrophobe à 2 dimensions dans le séquençage basé sur la MS (2D-HELS MS Seq). Cette méthode est capable de séquencer avec précision des séquences d’ARN uniques ainsi que des mélanges contenant jusqu’à 12 séquences d’ARN distinctes. En plus des quatre ribonucléotides canoniques (A, C, G et U), la méthode a la capacité de séquencer des oligonucléotides d’ARN contenant des nucléotides modifiés. Cela est possible parce que la nucléobase modifiée a soit une masse intrinsèquement unique qui peut aider à son identification et à son emplacement dans la séquence d’ARN, soit peut être convertie en un produit avec une masse unique. Dans cette étude, nous avons utilisé l’ARN, incorporant deux nucléotides modifiés représentatifs (pseudouridine (Ψ) et 5-méthylcytosine (m5C)), pour illustrer l’application de la méthode pour le séquençage de novo d’un seul oligonucléotide d’ARN ainsi que d’un mélange d’oligonucléotides d’ARN, chacun avec une séquence différente et/ou des nucléotides modifiés. Les procédures et les protocoles décrits ici pour séquencer ces ARN modèles seront applicables à d’autres échantillons d’ARN courts (<35 nt) lors de l’utilisation d’un système LC-MS standard à haute résolution, et peuvent également être utilisés pour la vérification de séquence d’oligonucléotides d’ARN thérapeutiques modifiés. À l’avenir, avec le développement d’algorithmes plus robustes et de meilleurs instruments, cette méthode pourrait permettre le séquençage d’échantillons biologiques plus complexes.
Des méthodes de séquençage basées sur la spectrométrie de masse (MS), y compris la MS descendante et la MSen tandem 1,2,3,4, ont été développées pour le séquençage direct de l’ARN. Cependant, les techniques de fragmentation in situ permettant de générer efficacement des échelles d’ARN de haute qualité dans les spectromètres de masse ne peuvent actuellement pas être appliquées au séquençage de novo 5,6. De plus, il n’est pas très trivial d’analyser les données MS unidimensionnelles (1D) traditionnelles pour le séquençage de novo d’une seule séquence d’ARN purifié, et ce serait encore plus difficile pour le séquençage MS d’échantillons d’ARN mixtes 7,8. Par conséquent, une méthode de séquençage de l’ARN bidimensionnelle (2D) basée sur la chromatographie liquide (LC)-MS a été développée, intégrant la production d’échelles de temps de rétention de masse (tR) 2D pour remplacer les échelles de masse 1D, ce qui facilite grandement l’identification des composants de l’échelle nécessaires au séquençage de novo des ARN8. Cependant, la méthode de séquençage de l’ARN basée sur la LC-MS 2D est principalement limitée à l’ARN court synthétique purifié, car elle ne peut pas lire une séquence complète uniquement sur la base d’une seule échelle, mais doit s’appuyer sur deux échelles adjacentes coexistantes (échelles 5' et 3')8. Plus précisément, cette approche nécessite des lectures bidirectionnelles à extrémités appariées pour la lecture des nucléobases terminales dans la région de faible masse8. La complexité supplémentaire de la lecture des extrémités appariées fait que cette méthode est intenable pour le séquençage des mélanges d’ARN, car la confusion est soulevée quant à savoir quel fragment d’échelle appartient à quelle échelle pour les échantillons inconnus.
Pour surmonter les obstacles mentionnés ci-dessus dans les approches de séquençage de l’ARN basées sur la SEP et pour élargir ces applications au séquençage direct de l’ARN, deux questions doivent être abordées : 1) comment générer une échelle de masse de haute qualité qui peut être utilisée pour lire une séquence complète, du premier nucléotide au dernier dans un brin d’ARN, et 2) comment identifier efficacement chaque échelle ARN/masse dans un ensemble de données MS complexe. Parallèlement à une dégradation acide bien contrôlée, nous avons développé une nouvelle méthode de séquençage en introduisant une stratégie de marquage hydrophobe (HELS) dans la technique de séquençage basée sur la MS, et nous avons résolu avec succès ces deux problèmes en ajoutant un marqueur hydrophobe à l’extrémité 5' et/ou 3' des ARN à séquencer9. Cette méthode crée une échelle de séquence « idéale » à partir de l’ARN : chaque fragment d’échelle dérive d’un clivage d’ARN spécifique au site exclusivement au niveau de chaque liaison phosphodiester, et la différence de masse entre deux fragments d’échelle adjacents est la masse exacte du nucléotide ou de la modification du nucléotide à cette position 8,9,10. Cela est possible parce que nous incluons une étape d’hydrolyse acide hautement contrôlée, qui fragmente l’ARN, en moyenne, une fois par molécule, avant qu’il ne soit injecté dans l’instrument. En conséquence, chaque produit de fragment de dégradation est détecté sur le spectromètre de masse et tous les fragments forment ensemble une échelle de séquençage 8,9,10. Cette nouvelle stratégie permet une lecture complète d’une séquence d’ARN à partir d’une seule échelle d’un brin d’ARN sans lecture d’extrémité appariée de l’autre échelle de l’ARN, et permet en outre le séquençage par MS de mélanges d’ARN avec plusieurs brins différents contenant des modifications nucléotidiques combinatoires9. En ajoutant une étiquette à l’extrémité 5' et/ou 3' de l’ARN, les fragments d’échelle marqués présentent un retard significatif de tR, ce qui peut aider à distinguer les deux échelles de masse l’une de l’autre et aussi de la région bruyante de faible masse. Le décalage mass-tR provoqué par l’ajout de l’étiquette hydrophobe facilite l’identification de l’échelle de masse et simplifie l’analyse des données pour la génération de séquences. De plus, l’ajout de l’étiquette hydrophobe peut aider à identifier la base terminale dans le brin en empêchant son fragment d’échelle correspondant d’être dans la région bruyante de faible masseR en raison de l’augmentation de la masse et de l’hydrophobie causée par l’étiquette, permettant ainsi l’identification de la séquence complète d’un ARN à partir d’une seule échelle ; Aucune lecture d’extrémité appariée n’est requise. En conséquence, nous avons déjà démontré le séquençage réussi d’un mélange complexe de jusqu’à 12 brins d’ARN distincts sans l’utilisation d’un algorithme de séquençage avancé9, ce qui ouvre la porte au séquençage MS de novo d’ARN contenant à la fois des nucléotides canoniques et modifiés et rend plus réalisable le séquençage d’échantillons d’ARN mixtes et plus complexes. En fait, en utilisant 2D-HELS MS Seq, nous avons même réussi à séquencer une population mixte d’échantillons d’ARNt10 et nous étendons activement son application à d’autres échantillons d’ARN complexes.
Pour faciliter le séquençage direct d’un plus large éventail d’échantillons d’ARN par 2D-HELS MS Seq, nous nous concentrerons ici sur les aspects techniques de cette approche de séquençage et couvrirons toutes les étapes essentielles nécessaires lors de l’application de la technique au séquençage direct d’échantillons d’ARN. Des exemples spécifiques seront utilisés pour illustrer la technique de séquençage, y compris des séquences d’ARN uniques synthétiques, des mélanges de plusieurs séquences d’ARN distinctes et des ARN modifiés contenant à la fois des nucléotides canoniques et modifiés tels que la pseudouridine (ψ) et la 5-méthylcytosine (m5C). Étant donné que les ARN contiennent tous des liaisons phosphodiester, tout type d’ARN peut être hydrolysé à l’acide pour générer une échelle de séquence idéale pour le séquençage 2D-HELS MS Seq dans des conditions optimales 8,9. Cependant, la détection de tous les fragments d’échelle d’un ARN donné dépend de l’instrument. Sur un LC-MS haute résolution standard (40K), la quantité de charge minimale pour le séquençage d’un échantillon d’ARN court purifié (<35 nt) est de 100 pmol par passage. Cependant, il faut plus de matériel (jusqu’à 400 pmol par échantillon d’ARN) lorsque des expériences supplémentaires doivent être menées (p. ex., pour distinguer les modifications de bases isomères qui partagent des masses identiques). Le protocole utilisé pour le séquençage du modèle d’ARN modifiés synthétiques sera également applicable au séquençage d’échantillons d’ARN plus larges, y compris des échantillons d’ARN biologiques avec des modifications de base inconnues. Cependant, une quantité d’échantillon encore plus importante, telle que 1000 pmol pour le séquençage de l’ARNt (~76 nt) à l’aide d’un instrument LC-MS standard, est nécessaire pour séquencer l’ARNt complet avec toutes les modifications, et un algorithme avancé doit être développé pour son séquençage de novo 10.
1. Concevoir des oligonucléotides d’ARN
2. Étiqueter l’extrémité 3' des ARN avec de la biotine
3. Capturer un échantillon d’ARN biotinylé sur des billes de streptavidine
4. Hydrolyse acide de l’ARN pour générer des échelles MS pour le séquençage
5. Convertir ψ en adduction CMC-ψ
6. Mesure LC-MS
7. Automatiser la génération de séquences d’ARN à l’aide d’un algorithme de calcul
REMARQUE : Cette procédure n’est illustrée que pour l’ARN #1 dans la figure 1c.
8. Séquençage des mélanges d’ARN
Introduire une étiquette de biotine à l’extrémité 3' de l’ARN pour produire des échelles de masse-tR facilement identifiables. Le flux de travail de l’approche 2D-HELS MS Seq est illustré à la figure 1a. Le marquage hydrophobe à la biotine introduit à l’extrémité 3' de l’ARN (voir section 2) augmente les masses et les tRs des composants de l’échelle marqués 3' par rapport à ceux de leurs homolo...
Contrairement à la fragmentation MS en tandem, l’hydrolyse acide hautement contrôlée est utilisée dans l’approche 2D-HELS MS Seq pour fragmenter l’ARN avant l’analyse avec un spectromètrede masse 9,10. En conséquence, chaque fragment dégradé à l’acide peut être détecté par l’instrument, formant l’équivalent d’une échelle de séquençage. Dans des conditions optimales, cette méthode crée une échell...
Les auteurs ont déposé un brevet provisoire lié à la technologie discutée dans ce manuscrit.
Les auteurs reconnaissent la subvention R21 des National Institutes of Health (1R21HG009576) à S. Z. et W. L. et les subventions de soutien institutionnel à la recherche et à la créativité du New York Institute of Technology (NYIT) à S. Z., qui ont soutenu ce travail. Les auteurs tiennent à remercier le doctorant Xuanting Wang (Université Columbia) pour son aide à la création de figures, et remercient le professeur Michael Hadjiargyrou (NYIT), le professeur Jingyue Ju (Université Columbia), les Drs James Russo, Shiv Kumar, Xiaoxu Li, Steffen Jockusch et d’autres membres du laboratoire Ju (Université Columbia), le Dr Yongdong Wang (Cerno Bioscience), Meina Aziz (NYIT) et Wenhao Ni (NYIT) pour les discussions et suggestions utiles pour notre manuscrit.
Name | Company | Catalog Number | Comments |
5' DNA Adenylation kit | New England Biolabs | E2610S | 50uM concentration |
6550 Q-TOF mass spectrometer | Agilent Technologies | 5991-2116EN | Coupled to a 1290 Infinity LC system |
A(5´)pp(5´)Cp-TEG-biotin-3´ | ChemGenes | 91718 | HPLC purified |
ATPγS | Sigma-Aldrich | 11162306001 | Lithium salt |
Bicine | Sigma-Aldrich | B8660 | BioXtra, ≥99% (titration) |
Biotin maleimide | Vector Laboratories | SP-1501 | Long arm |
C18 column | Waters | 186003532 | 50 mm × 2.1 mm Xbridge C18 column with a particle size of 1.7 μm |
Centrifugal Vacuum Concentrator | Labconco | Refrig 115v/60hz 7310022 | Labconco CentriVap |
ChemBioDraw | PerkinElmer | ChemDraw Prime | Generate a chemical structure and property data of structures & fragments |
CMC (N-cyclohexyl-N?-(2-morpholinoethyl)-carbodiimide metho-p-toluenesulfonate) | Sigma-Aldrich | 2491-17-0 | 95% Purifiy |
Cyanine3 maleimide (Cy3) | Lumiprobe | 11080 | Water insoluble |
DEPC-treated water | Thermo Fisher Scientific | AM9906 | Autoclaved, certified nuclease-free |
Diisopropylamine (DIPA) | Thermo Fisher Scientific | 108-18-9 | 99% Alfa Aesar |
DMSO | Sigma-Aldrich | 276855 | Anhydrous dimethyl sulfoxide, 99.9% |
EDTA | Sigma-Aldrich | E6758 | Anhydrous, crystalline, BioReagent, suitable for cell culture |
Formic acid | Merck | 64-18-6 | 98-100%, ACS reag, Ph Eur |
Hexafluoro-2-propanol (HFIP) | Thermo Fisher Scientific | 920-66-1 | 99% Acros Organics |
LC-MS sample vials | Thermo Fisher Scientific | C4000-11 | Plastic screw thread vials |
LC-MS vial caps | Thermo Fisher Scientific | C5000-54A | Autosampler vial screw thread caps |
Na2CO3 buffer | Sigma-Aldrich | 88975 | BioUltra, >0.1 M Na2CO3, >0.2 M NaHCO3 |
Oligo Clean & Concentrator | Zymo Research | D4060 | Spin column |
OriginLab | OriginLab | OriginPro | Data analysis and graphing software |
pCp-biotin | TriLink BioTechnologies | NU-1706-BIO | 20 ul (1 mM) |
RNA #1--#6 | Integrated DNA Technologies | Custom RNA oligos | 19nt-21nt single-stranded RNAs, used without further purification |
Rocking platform shaker | VWR | Orbital Shaker Standard 1000 | Speed Range 40 to 300 rpm |
Streptavidin magnetic beads | Thermo Fisher Scientific | 88816 | Binding approx. 55ug biotinylated rabbit lgG per mg of beads |
Sulfonated Cyanine3 maleimide | Lumiprobe | 11380 | Water soluble |
T4 DNA ligase 1 | New England Biolabs | M0202S | 400 units/uL |
T4 polynucleotide kinase | Sigma-Aldrich | T4PNK-RO | From phage T4 am N81 pse T1 infected Escherichia coli BB |
Tris-HCl buffer | Sigma-Aldrich | T6455 | Tris-HCl Buffer, pH 10, 10×, Antigen Retriever |
Urea | Sigma-Aldrich | 81871 | Urea for synthesis. CAS No. 57-13-6, EC Number 200-315-5. |
Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE
Demande d’autorisationThis article has been published
Video Coming Soon