Se requiere una suscripción a JoVE para ver este contenido. Inicie sesión o comience su prueba gratuita.
Method Article
Aquí, describimos un protocolo detallado para un método de secuenciación basado en LC-MS que se puede utilizar como método directo para secuenciar ARN corto (<35 nt por ejecución) sin un intermedio de ADNc, y como método general para secuenciar diferentes modificaciones de nucleótidos en un solo estudio con precisión de una sola base.
Se ha demostrado que los enfoques de secuenciación basados en espectrometría de masas (MS) son útiles en la secuenciación directa de ARN sin necesidad de un intermediario de ADN complementario (ADNc). Sin embargo, estos enfoques rara vez se aplican como un método de secuenciación de ARN de novo , sino que se utilizan principalmente como una herramienta que puede ayudar en el aseguramiento de la calidad para confirmar secuencias conocidas de muestras de ARN monocatenario purificadas. Recientemente, desarrollamos un método de secuenciación directa de ARN mediante la integración de una estrategia de etiquetado final hidrofóbico en tiempo de retención de masa en 2 dimensiones en secuenciación basada en MS (2D-HELS MS Seq). Este método es capaz de secuenciar con precisión secuencias individuales de ARN, así como mezclas que contienen hasta 12 secuencias de ARN distintas. Además de los cuatro ribonucleótidos canónicos (A, C, G y U), el método tiene la capacidad de secuenciar oligonucleótidos de ARN que contienen nucleótidos modificados. Esto es posible porque la nucleobase modificada tiene una masa intrínsecamente única que puede ayudar en su identificación y su ubicación en la secuencia de ARN, o se puede convertir en un producto con una masa única. En este estudio, hemos utilizado ARN, incorporando dos nucleótidos modificados representativos (pseudouridina (Ψ) y 5-metilcitosina (m5C)), para ilustrar la aplicación del método para la secuenciación de novo de un solo oligonucleótido de ARN, así como una mezcla de oligonucleótidos de ARN, cada uno con una secuencia diferente y/o nucleótidos modificados. Los procedimientos y protocolos descritos aquí para secuenciar estos ARN modelo serán aplicables a otras muestras cortas de ARN (<35 nt) cuando se utilice un sistema LC-MS estándar de alta resolución, y también se pueden utilizar para la verificación de la secuencia de oligonucleótidos de ARN terapéuticos modificados. En el futuro, con el desarrollo de algoritmos más robustos y con mejores instrumentos, este método podría permitir la secuenciación de muestras biológicas más complejas.
Se han desarrollado métodos de secuenciación basados en espectrometría de masas (MS), incluida la MS de arriba hacia abajo y la MS en tándem 1,2,3,4, para la secuenciación directa de ARN. Sin embargo, las técnicas de fragmentación in situ para generar eficazmente escaleras de ARN de alta calidad en espectrómetros de masas actualmente no se pueden aplicar a la secuenciación de novo 5,6. Además, no es muy trivial analizar los datos tradicionales de MS unidimensional (1D) para la secuenciación de novo de incluso una secuencia de ARN purificado, y sería aún más difícil para la secuenciación de MS de muestras de ARN mixto 7,8. Por lo tanto, se ha desarrollado un método de secuenciación de ARN basado en cromatografía líquida (LC)-MS bidimensional (2D), que incorpora la producción de escaleras de tiempo de retención de masa (tR) 2D para reemplazar las escaleras de masa 1D, lo que facilita mucho la identificación de los componentes de la escalera necesarios para la secuenciación de novo de ARN8. Sin embargo, el método de secuenciación de ARN 2D LC-MS se limita principalmente a ARN corto sintético purificado, ya que no puede leer una secuencia completa basándose únicamente en una sola escalera, sino que debe basarse en dos escaleras adyacentes coexistentes (escaleras de 5' y 3')8. Más específicamente, este enfoque requiere lecturas bidireccionales de extremos emparejados para leer nucleobases terminales en la región de baja masa8. La complejidad añadida de la lectura de los extremos emparejados hace que este método sea insostenible para la secuenciación de mezclas de ARN porque se genera confusión sobre qué fragmento de escalera pertenece a qué escalera para las muestras desconocidas.
Para superar las barreras mencionadas anteriormente en los enfoques de secuenciación de ARN basados en MS y ampliar dichas aplicaciones en la secuenciación directa de ARN, se deben abordar dos cuestiones: 1) cómo generar una escalera de masa de alta calidad que se pueda utilizar para leer una secuencia completa, desde el primer nucleótido hasta el último en una cadena de ARN, y 2) cómo identificar eficazmente cada escalera de ARN/masa en un conjunto de datos complejos de MS. Junto con la degradación ácida bien controlada, hemos desarrollado un nuevo método de secuenciación mediante la introducción de una estrategia de etiquetado final hidrofóbico (HELS) en la técnica de secuenciación basada en MS, y abordamos con éxito estos dos problemas mediante la adición de una etiqueta hidrofóbica en el extremo 5' y/o 3' de los ARN que se van a secuenciar9. Este método crea una escalera de secuencia "ideal" a partir de ARN: cada fragmento de escalera deriva de la escisión de ARN específica del sitio exclusivamente en cada enlace fosfodiéster, y la diferencia de masa entre dos fragmentos de escalera adyacentes es la masa exacta del nucleótido o la modificación del nucleótido en esa posición 8,9,10. Esto es posible porque incluimos una etapa de hidrólisis ácida altamente controlada, que fragmenta el ARN, en promedio, una vez por molécula, antes de que se inyecte en el instrumento. Como resultado, cada producto de fragmento de degradación se detecta en el espectrómetro de masas y todos los fragmentos juntos forman una escalera de secuenciación 8,9,10. Esta nueva estrategia permite la lectura completa de una secuencia de ARN de una sola escalera de una cadena de ARN sin la lectura de extremos emparejados de la otra escalera del ARN y, además, permite la secuenciación de MS de mezclas de ARN con múltiples hebras diferentes que contienen modificaciones combinatorias de nucleótidos9. Al agregar una etiqueta en el extremo 5' y/o 3' del ARN, los fragmentos de escalera marcados muestran un retraso significativo de tR, lo que puede ayudar a distinguir las dos escaleras de masa entre sí y también de la región ruidosa de baja masa. El desplazamiento de masa-tR causado por la adición de la etiqueta hidrofóbica facilita la identificación de la escalera de masa y simplifica el análisis de datos para la generación de secuencias. Además, la adición de la etiqueta hidrofóbica puede ayudar a identificar la base terminal en la hebra al evitar que su fragmento de escalera correspondiente esté en la regiónR de baja masa y baja ruido debido al aumento de masa e hidrofobicidad causado por la etiqueta, lo que permite la identificación de la secuencia completa de un ARN a partir de una sola escalera; No se requieren lecturas de extremo emparejado. Como resultado, hemos demostrado previamente la secuenciación exitosa de una mezcla compleja de hasta 12 hebras distintas de ARN sin el uso de ningún algoritmo de secuenciación avanzado9, lo que abre la puerta a la secuenciación MS de novo de ARN que contiene nucleótidos canónicos y modificados y lo hace más factible para la secuenciación de muestras de ARN mixtas y más complejas. De hecho, utilizando 2D-HELS MS Seq, incluso hemos secuenciado con éxito una población mixta de muestras de ARNt10 y estamos ampliando activamente su aplicación a otras muestras de ARN complejas.
Para facilitar que 2D-HELS MS Seq secuencie directamente una gama más amplia de muestras de ARN, aquí nos centraremos en los aspectos técnicos de este enfoque de secuenciación y cubriremos todos los pasos esenciales necesarios al aplicar la técnica hacia la secuenciación directa de muestras de ARN. Se utilizarán ejemplos específicos para ilustrar la técnica de secuenciación, incluidas secuencias sintéticas de ARN único, mezclas de múltiples secuencias de ARN distintas y ARN modificados que contienen nucleótidos canónicos y modificados, como pseudouridina (ψ) y 5-metilcitosina (m5C). Dado que todos los ARN contienen enlaces fosfodiéster, cualquier tipo de ARN puede ser hidrolizado con ácido para generar una escalera de secuencia ideal para 2D-HELS MS Seq en condiciones óptimas 8,9. Sin embargo, la detección de todos los fragmentos de escalera de un ARN dado depende del instrumento. En una LC-MS estándar de alta resolución (40K), la cantidad mínima de carga para secuenciar una muestra de ARN corto purificada (<35 nt) es de 100 pmol por ejecución. Sin embargo, se requiere más material (hasta 400 pmol por muestra de ARN) cuando se deben realizar experimentos adicionales (por ejemplo, para distinguir modificaciones de bases isoméricas que comparten masas idénticas). El protocolo utilizado en la secuenciación del modelo de ARN sintético modificado también será aplicable a la secuenciación de muestras de ARN más amplias, incluidas las muestras de ARN biológico con modificaciones de bases desconocidas. Sin embargo, se requiere una cantidad de muestra aún mayor, como 1000 pmol para secuenciar el ARNt (~76 nt) utilizando un instrumento LC-MS estándar, para secuenciar el ARNt completo con todas las modificaciones, y se debe desarrollar un algoritmo avanzado para su secuenciación de novo 10.
1. Diseño de oligonucleótidos de ARN
2. Etiquete el extremo 3' de los ARN con biotina
3. Captura de una muestra de ARN biotinilado en perlas de estreptavidina
4. Hidrólisis ácida de ARN para generar escaleras de MS para la secuenciación
5. Convertir ψ a aducto CMC-ψ
6. Medición LC-MS
7. Automatizar la generación de secuencias de ARN mediante un algoritmo computacional
NOTA: Este procedimiento se muestra solo para el ARN #1 en la Figura 1c.
8. Secuenciación de mezclas de ARN
Introducción de una etiqueta de biotina en el extremo 3' del ARN para producir escaleras de masa-tR fácilmente identificables. En la Figura 1a se muestra el flujo de trabajo del enfoque MS Seq 2D-HELS. La marca hidrofóbica de biotina introducida en el extremo 3' del ARN (ver Sección 2) aumenta las masas y tRs de los componentes de la escalera marcados con 3' en comparación con los de sus contrapartes no marcadas. P...
A diferencia de la fragmentación de MS basada en tándem, la hidrólisis ácida altamente controlada se utiliza en el enfoque 2D-HELS MS Seq para fragmentar el ARN antes del análisis con un espectrómetro de masas 9,10. Como resultado, el instrumento puede detectar cada fragmento degradado en ácido, formando el equivalente a una escalera de secuenciación. En condiciones óptimas, este método crea una escalera de secuencia "i...
Los autores han presentado una patente provisional relacionada con la tecnología discutida en este manuscrito.
Los autores agradecen la subvención R21 de los Institutos Nacionales de Salud (1R21HG009576) a S. Z. y W. L. y las subvenciones de Apoyo Institucional para la Investigación y la Creatividad del Instituto de Tecnología de Nueva York (NYIT) a S. Z., que apoyaron este trabajo. Los autores desean agradecer al estudiante de doctorado Xuanting Wang (Universidad de Columbia) por ayudar en la creación de figuras, y agradecer al Prof. Michael Hadjiargyrou (NYIT), al Prof. Jingyue Ju (Universidad de Columbia), a los Dres. James Russo, Shiv Kumar, Xiaoxu Li, Steffen Jockusch y a otros miembros del laboratorio Ju (Universidad de Columbia), al Dr. Yongdong Wang (Cerno Bioscience), Meina Aziz (NYIT) y Wenhao Ni (NYIT) por sus útiles discusiones y sugerencias para nuestro manuscrito.
Name | Company | Catalog Number | Comments |
5' DNA Adenylation kit | New England Biolabs | E2610S | 50uM concentration |
6550 Q-TOF mass spectrometer | Agilent Technologies | 5991-2116EN | Coupled to a 1290 Infinity LC system |
A(5´)pp(5´)Cp-TEG-biotin-3´ | ChemGenes | 91718 | HPLC purified |
ATPγS | Sigma-Aldrich | 11162306001 | Lithium salt |
Bicine | Sigma-Aldrich | B8660 | BioXtra, ≥99% (titration) |
Biotin maleimide | Vector Laboratories | SP-1501 | Long arm |
C18 column | Waters | 186003532 | 50 mm × 2.1 mm Xbridge C18 column with a particle size of 1.7 μm |
Centrifugal Vacuum Concentrator | Labconco | Refrig 115v/60hz 7310022 | Labconco CentriVap |
ChemBioDraw | PerkinElmer | ChemDraw Prime | Generate a chemical structure and property data of structures & fragments |
CMC (N-cyclohexyl-N?-(2-morpholinoethyl)-carbodiimide metho-p-toluenesulfonate) | Sigma-Aldrich | 2491-17-0 | 95% Purifiy |
Cyanine3 maleimide (Cy3) | Lumiprobe | 11080 | Water insoluble |
DEPC-treated water | Thermo Fisher Scientific | AM9906 | Autoclaved, certified nuclease-free |
Diisopropylamine (DIPA) | Thermo Fisher Scientific | 108-18-9 | 99% Alfa Aesar |
DMSO | Sigma-Aldrich | 276855 | Anhydrous dimethyl sulfoxide, 99.9% |
EDTA | Sigma-Aldrich | E6758 | Anhydrous, crystalline, BioReagent, suitable for cell culture |
Formic acid | Merck | 64-18-6 | 98-100%, ACS reag, Ph Eur |
Hexafluoro-2-propanol (HFIP) | Thermo Fisher Scientific | 920-66-1 | 99% Acros Organics |
LC-MS sample vials | Thermo Fisher Scientific | C4000-11 | Plastic screw thread vials |
LC-MS vial caps | Thermo Fisher Scientific | C5000-54A | Autosampler vial screw thread caps |
Na2CO3 buffer | Sigma-Aldrich | 88975 | BioUltra, >0.1 M Na2CO3, >0.2 M NaHCO3 |
Oligo Clean & Concentrator | Zymo Research | D4060 | Spin column |
OriginLab | OriginLab | OriginPro | Data analysis and graphing software |
pCp-biotin | TriLink BioTechnologies | NU-1706-BIO | 20 ul (1 mM) |
RNA #1--#6 | Integrated DNA Technologies | Custom RNA oligos | 19nt-21nt single-stranded RNAs, used without further purification |
Rocking platform shaker | VWR | Orbital Shaker Standard 1000 | Speed Range 40 to 300 rpm |
Streptavidin magnetic beads | Thermo Fisher Scientific | 88816 | Binding approx. 55ug biotinylated rabbit lgG per mg of beads |
Sulfonated Cyanine3 maleimide | Lumiprobe | 11380 | Water soluble |
T4 DNA ligase 1 | New England Biolabs | M0202S | 400 units/uL |
T4 polynucleotide kinase | Sigma-Aldrich | T4PNK-RO | From phage T4 am N81 pse T1 infected Escherichia coli BB |
Tris-HCl buffer | Sigma-Aldrich | T6455 | Tris-HCl Buffer, pH 10, 10×, Antigen Retriever |
Urea | Sigma-Aldrich | 81871 | Urea for synthesis. CAS No. 57-13-6, EC Number 200-315-5. |
Solicitar permiso para reutilizar el texto o las figuras de este JoVE artículos
Solicitar permisoThis article has been published
Video Coming Soon
ACERCA DE JoVE
Copyright © 2025 MyJoVE Corporation. Todos los derechos reservados