È necessario avere un abbonamento a JoVE per visualizzare questo. Accedi o inizia la tua prova gratuita.
Method Article
Qui, descriviamo un protocollo dettagliato per un metodo di sequenziamento basato su LC-MS che può essere utilizzato come metodo diretto per sequenziare RNA corto (<35 nt per corsa) senza un intermedio di cDNA e come metodo generale per sequenziare diverse modifiche nucleotidiche in un singolo studio con precisione a base singola.
Gli approcci di sequenziamento basati sulla spettrometria di massa (MS) si sono dimostrati utili nel sequenziamento diretto dell'RNA senza la necessità di un intermedio di DNA complementare (cDNA). Tuttavia, tali approcci sono raramente applicati come metodo di sequenziamento dell'RNA de novo , ma utilizzati principalmente come strumento che può aiutare a garantire la qualità per confermare sequenze note di campioni di RNA purificati a singolo filamento. Recentemente, abbiamo sviluppato un metodo di sequenziamento diretto dell'RNA integrando una strategia di marcatura idrofobica del tempo di ritenzione della massa bidimensionale nel sequenziamento basato su MS (2D-HELS MS Seq). Questo metodo è in grado di sequenziare con precisione singole sequenze di RNA e miscele contenenti fino a 12 sequenze di RNA distinte. Oltre ai quattro ribonucleotidi canonici (A, C, G e U), il metodo ha la capacità di sequenziare oligonucleotidi di RNA contenenti nucleotidi modificati. Ciò è possibile perché la base nucleotica modificata ha una massa intrinsecamente unica che può aiutare nella sua identificazione e nella sua posizione nella sequenza di RNA, oppure può essere convertita in un prodotto con una massa unica. In questo studio, abbiamo utilizzato l'RNA, incorporando due nucleotidi modificati rappresentativi (pseudouridina (Ψ) e 5-metilcitosina (m5C)), per illustrare l'applicazione del metodo per il sequenziamento de novo di un singolo oligonucleotide di RNA e di una miscela di oligonucleotidi di RNA, ciascuno con una sequenza diversa e/o nucleotidi modificati. Le procedure e i protocolli qui descritti per sequenziare questi RNA modello saranno applicabili ad altri campioni di RNA corti (<35 nt) quando si utilizza un sistema LC-MS standard ad alta risoluzione e possono anche essere utilizzati per la verifica della sequenza di oligonucleotidi di RNA terapeutici modificati. In futuro, con lo sviluppo di algoritmi più robusti e con strumenti migliori, questo metodo potrebbe consentire il sequenziamento di campioni biologici più complessi.
Per il sequenziamento diretto dell'RNA sono stati sviluppati metodi di sequenziamento basati sulla spettrometria di massa (MS), tra cui MS top-down e MS 1,2,3,4 in tandem. Tuttavia, le tecniche di frammentazione in situ per generare efficacemente scale di RNA di alta qualità negli spettrometri di massa attualmente non possono essere applicate al sequenziamento de novo 5,6. Inoltre, non è molto banale analizzare i tradizionali dati MS unidimensionali (1D) per il sequenziamento de novo anche di una sola sequenza di RNA purificata, e sarebbe ancora più impegnativo per il sequenziamento MS di campioni di RNA misti 7,8. Pertanto, è stato sviluppato un metodo di sequenziamento dell'RNA basato su cromatografia liquida (LC)-MS bidimensionale (2D), che incorpora la produzione di scale 2D per il tempo di ritenzione di massa (tR) per sostituire le scale di massa 1D, rendendo molto più facile l'identificazione dei componenti della scala necessari per il sequenziamento de novo degli RNA8. Tuttavia, il metodo di sequenziamento dell'RNA basato su LC-MS 2D è principalmente limitato all'RNA corto sintetico purificato, in quanto non è in grado di leggere una sequenza completa basata esclusivamente su una singola scala, ma deve basarsi su due scale adiacenti coesistenti (scale da 5' e 3')8. Più specificamente, questo approccio richiede letture bidirezionali di estremità accoppiate per la lettura di basi nucleotiche terminali nella regione di bassa massa8. L'aggiunta complessità della lettura paired-end fa sì che questo metodo sia insostenibile per il sequenziamento di miscele di RNA perché si crea confusione su quale frammento di ladder appartenga a quale ladder per i campioni sconosciuti.
Per superare le barriere sopra menzionate negli approcci di sequenziamento dell'RNA basati sulla SM e per ampliare tali applicazioni nel sequenziamento diretto dell'RNA, devono essere affrontate due questioni: 1) come generare una scala di massa di alta qualità che possa essere utilizzata per leggere una sequenza completa, dal primo nucleotide all'ultimo in un filamento di RNA, e 2) come identificare efficacemente ogni scala RNA/massa in un complesso set di dati MS. Insieme a una degradazione acida ben controllata, abbiamo sviluppato un nuovo metodo di sequenziamento introducendo una strategia di marcatura idrofobica (HELS) nella tecnica di sequenziamento basata su MS e abbiamo affrontato con successo questi due problemi aggiungendo un tag idrofobico all'estremità 5' e/o 3' degli RNA da sequenziare9. Questo metodo crea una scala di sequenza "ideale" dall'RNA: ogni frammento di scala deriva dalla scissione dell'RNA sito-specifica esclusivamente in corrispondenza di ogni legame fosfodiestere e la differenza di massa tra due frammenti di scala adiacenti è la massa esatta del nucleotide o della modifica nucleotidica in quella posizione 8,9,10. Questo è possibile perché includiamo una fase di idrolisi acida altamente controllata, che frammenta l'RNA, in media, una volta per molecola, prima di essere iniettato nello strumento. Di conseguenza, ogni prodotto del frammento di degradazione viene rilevato sullo spettrometro di massa e tutti i frammenti insieme formano una scala di sequenziamento 8,9,10. Questa nuova strategia consente la lettura completa di una sequenza di RNA da una singola scala di un filamento di RNA senza la lettura di estremità accoppiate dall'altra scala dell'RNA e consente inoltre il sequenziamento MS di miscele di RNA con più filamenti diversi che contengono modificazioni nucleotidiche combinatorie9. Aggiungendo un tag all'estremità 5' e/o 3' dell'RNA, i frammenti di scala marcati mostrano un ritardo significativo di tR, che può aiutare a distinguere le due scale di massa l'una dall'altra e anche dalla regione rumorosa di bassa massa. Lo spostamento di massa-tR causato dall'aggiunta del tag idrofobico facilita l'identificazione della scala di massa e semplifica l'analisi dei dati per la generazione della sequenza. Inoltre, l'aggiunta del tag idrofobico può aiutare a identificare la base terminale nel filamento impedendo che il suo corrispondente frammento di scala si trovi nella rumorosa regioneR a bassa massa-t a causa dell'aumento di massa e idrofobicità causato dal tag, consentendo così l'identificazione della sequenza completa di un RNA da una singola scala; Non sono necessarie letture paired-end. Di conseguenza, abbiamo precedentemente dimostrato il successo del sequenziamento di una miscela complessa di un massimo di 12 filamenti distinti di RNA senza l'uso di alcun algoritmo di sequenziamento avanzato9, che apre la porta al sequenziamento de novo MS di RNA contenente sia nucleotidi canonici che modificati e lo rende più fattibile per il sequenziamento di campioni di RNA misti e più complessi. Infatti, utilizzando 2D-HELS MS Seq, abbiamo persino sequenziato con successo una popolazione mista di campioni di tRNA10 e stiamo espandendo attivamente la sua applicazione ad altri campioni di RNA complessi.
Per facilitare il sequenziamento diretto di una gamma più ampia di campioni di RNA da parte di 2D-HELS MS, qui ci concentreremo sugli aspetti tecnici di questo approccio di sequenziamento e tratteremo tutti i passaggi essenziali necessari per l'applicazione della tecnica verso il sequenziamento diretto di campioni di RNA. Esempi specifici saranno utilizzati per illustrare la tecnica di sequenziamento, tra cui sequenze sintetiche di RNA singole, miscele di più sequenze di RNA distinte e RNA modificati contenenti sia nucleotidi canonici che modificati come la pseudouridina (ψ) e la 5-metilcitosina (m5C). Poiché tutti gli RNA contengono legami fosfodiestere, qualsiasi tipo di RNA può essere idrolizzato in acido per generare una scala di sequenza ideale per 2D-HELS MS Seq in condizioni ottimali 8,9. Tuttavia, il rilevamento di tutti i frammenti ladder di un dato RNA dipende dallo strumento. Su una LC-MS standard ad alta risoluzione (40K), la quantità minima di carico per il sequenziamento di un campione di RNA corto purificato (<35 nt) è di 100 pmol per corsa. Tuttavia, è necessario più materiale (fino a 400 pmol per campione di RNA) quando devono essere condotti ulteriori esperimenti (ad esempio, per distinguere le modifiche delle basi isomeriche che condividono masse identiche). Il protocollo utilizzato nel sequenziamento del modello di RNA modificato sintetico sarà applicabile anche al sequenziamento di campioni di RNA più ampi, compresi i campioni di RNA biologici con modifiche di base sconosciute. Tuttavia, è necessaria una quantità di campione ancora maggiore, come 1000 pmol per il sequenziamento del tRNA (~76 nt) utilizzando uno strumento LC-MS standard, per sequenziare il tRNA completo con tutte le modifiche, e deve essere sviluppato un algoritmo avanzato per il suo sequenziamento de novo 10.
1. Progettazione di oligonucleotidi di RNA
2. Marcare l'estremità 3' degli RNA con la biotina
3. Cattura il campione di RNA biotinilato su perle di streptavidina
4. Idrolisi acida dell'RNA per generare scale di SM per il sequenziamento
5. Converti ψ in addotto CMC-ψ
6. Misurazione LC-MS
7. Automatizzare la generazione di sequenze di RNA mediante un algoritmo computazionale
NOTA: Questa procedura è mostrata solo per l'RNA #1 nella Figura 1c.
8. Sequenziamento di miscele di RNA
Introduzione di un tag di biotina all'estremità 3' dell'RNA per produrre scaleR di massa-t facilmente identificabili. Il flusso di lavoro dell'approccio 2D-HELS MS Seq è illustrato nella Figura 1a. L'etichetta idrofoba della biotina introdotta all'estremità 3' dell'RNA (vedi Sezione 2) aumenta le masse e i tRs dei componenti ladder marcati con 3' rispetto a quelli delle loro controparti non marcate. Pertanto, la curv...
A differenza della frammentazione MS basata sul tandem, l'idrolisi acida altamente controllata viene utilizzata nell'approccio 2D-HELS MS Seq per frammentare l'RNA prima dell'analisi con uno spettrometro di massa 9,10. Di conseguenza, ogni frammento degradato con acido può essere rilevato dallo strumento, formando l'equivalente di una scala di sequenziamento. In condizioni ottimali, questo metodo crea una scala di sequenza "idea...
Gli autori hanno depositato un brevetto provvisorio relativo alla tecnologia discussa in questo manoscritto.
Gli autori riconoscono la sovvenzione R21 del National Institutes of Health (1R21HG009576) a S. Z. e W. L. e le sovvenzioni del New York Institute of Technology (NYIT) Institutional Support for Research and Creativity a S. Z., che ha sostenuto questo lavoro. Gli autori desiderano ringraziare il dottorando Xuanting Wang (Columbia University) per l'assistenza nella creazione di figure, e ringraziare il Prof. Michael Hadjiargyrou (NYIT), il Prof. Jingyue Ju (Columbia University), i Dottori James Russo, Shiv Kumar, Xiaoxu Li, Steffen Jockusch e altri membri del laboratorio Ju (Columbia University), il Dott. Yongdong Wang (Cerno Bioscience), Meina Aziz (NYIT) e Wenhao Ni (NYIT) per le utili discussioni e suggerimenti per il nostro manoscritto.
Name | Company | Catalog Number | Comments |
5' DNA Adenylation kit | New England Biolabs | E2610S | 50uM concentration |
6550 Q-TOF mass spectrometer | Agilent Technologies | 5991-2116EN | Coupled to a 1290 Infinity LC system |
A(5´)pp(5´)Cp-TEG-biotin-3´ | ChemGenes | 91718 | HPLC purified |
ATPγS | Sigma-Aldrich | 11162306001 | Lithium salt |
Bicine | Sigma-Aldrich | B8660 | BioXtra, ≥99% (titration) |
Biotin maleimide | Vector Laboratories | SP-1501 | Long arm |
C18 column | Waters | 186003532 | 50 mm × 2.1 mm Xbridge C18 column with a particle size of 1.7 μm |
Centrifugal Vacuum Concentrator | Labconco | Refrig 115v/60hz 7310022 | Labconco CentriVap |
ChemBioDraw | PerkinElmer | ChemDraw Prime | Generate a chemical structure and property data of structures & fragments |
CMC (N-cyclohexyl-N?-(2-morpholinoethyl)-carbodiimide metho-p-toluenesulfonate) | Sigma-Aldrich | 2491-17-0 | 95% Purifiy |
Cyanine3 maleimide (Cy3) | Lumiprobe | 11080 | Water insoluble |
DEPC-treated water | Thermo Fisher Scientific | AM9906 | Autoclaved, certified nuclease-free |
Diisopropylamine (DIPA) | Thermo Fisher Scientific | 108-18-9 | 99% Alfa Aesar |
DMSO | Sigma-Aldrich | 276855 | Anhydrous dimethyl sulfoxide, 99.9% |
EDTA | Sigma-Aldrich | E6758 | Anhydrous, crystalline, BioReagent, suitable for cell culture |
Formic acid | Merck | 64-18-6 | 98-100%, ACS reag, Ph Eur |
Hexafluoro-2-propanol (HFIP) | Thermo Fisher Scientific | 920-66-1 | 99% Acros Organics |
LC-MS sample vials | Thermo Fisher Scientific | C4000-11 | Plastic screw thread vials |
LC-MS vial caps | Thermo Fisher Scientific | C5000-54A | Autosampler vial screw thread caps |
Na2CO3 buffer | Sigma-Aldrich | 88975 | BioUltra, >0.1 M Na2CO3, >0.2 M NaHCO3 |
Oligo Clean & Concentrator | Zymo Research | D4060 | Spin column |
OriginLab | OriginLab | OriginPro | Data analysis and graphing software |
pCp-biotin | TriLink BioTechnologies | NU-1706-BIO | 20 ul (1 mM) |
RNA #1--#6 | Integrated DNA Technologies | Custom RNA oligos | 19nt-21nt single-stranded RNAs, used without further purification |
Rocking platform shaker | VWR | Orbital Shaker Standard 1000 | Speed Range 40 to 300 rpm |
Streptavidin magnetic beads | Thermo Fisher Scientific | 88816 | Binding approx. 55ug biotinylated rabbit lgG per mg of beads |
Sulfonated Cyanine3 maleimide | Lumiprobe | 11380 | Water soluble |
T4 DNA ligase 1 | New England Biolabs | M0202S | 400 units/uL |
T4 polynucleotide kinase | Sigma-Aldrich | T4PNK-RO | From phage T4 am N81 pse T1 infected Escherichia coli BB |
Tris-HCl buffer | Sigma-Aldrich | T6455 | Tris-HCl Buffer, pH 10, 10×, Antigen Retriever |
Urea | Sigma-Aldrich | 81871 | Urea for synthesis. CAS No. 57-13-6, EC Number 200-315-5. |
Richiedi autorizzazione per utilizzare il testo o le figure di questo articolo JoVE
Richiedi AutorizzazioneThis article has been published
Video Coming Soon