Se requiere una suscripción a JoVE para ver este contenido. Inicie sesión o comience su prueba gratuita.
Method Article
Este método describe los pasos para mejorar la calidad y la cantidad de datos de secuencia que se pueden obtener a partir de muestras de ARN incrustadas de parafina fija de formalina (FFPE). Describimos la metodología para evaluar con mayor precisión la calidad de las muestras de FFPE-RNA, preparar bibliotecas de secuenciación y analizar los datos de muestras de ARN FFPE.
El análisis de la expresión génica mediante la secuenciación de ARN (RNA-seq) permite obtener información única sobre muestras clínicas que pueden conducir potencialmente a una comprensión mecanicista de la base de diversas enfermedades, así como mecanismos de resistencia y/o susceptibilidad. Sin embargo, los tejidos FFPE, que representan el método más común para preservar la morfología tisular en muestras clínicas, no son las mejores fuentes para el análisis de perfiles de expresión génica. El ARN obtenido de tales muestras a menudo se degrada, fragmenta y se modifica químicamente, lo que conduce a bibliotecas de secuenciación subóptimas. A su vez, estos generan datos de secuencia de mala calidad que pueden no ser confiables para el análisis de expresión génica y el descubrimiento de mutaciones. Con el fin de aprovechar al máximo las muestras de FFPE y obtener los mejores datos posibles de muestras de baja calidad, es importante tomar ciertas precauciones mientras se planifica el diseño experimental, se preparan bibliotecas de secuenciación y durante el análisis de datos. Esto incluye el uso de métricas adecuadas para un control preciso de la calidad de la muestra (QC), la identificación de los mejores métodos para varios pasos durante la generación de la biblioteca de secuenciación y el control de calidad cuidadoso de la biblioteca. Además, la aplicación de herramientas y parámetros de software correctos para el análisis de datos de secuencia es fundamental para identificar artefactos en los datos de ARN-seq, filtrar la contaminación y lecturas de baja calidad, evaluar la uniformidad de la cobertura génica y medir la reproducibilidad de los perfiles de expresión génica entre réplicas biológicas. Estos pasos pueden garantizar una alta precisión y reproducibilidad para el perfilado de muestras de ARN muy heterogéneas. Aquí describimos los diversos pasos para el control de calidad de la muestra, la preparación de la biblioteca y el control de calidad, la secuenciación y el análisis de datos que pueden ayudar a aumentar la cantidad de datos útiles obtenidos de ARN de baja calidad, como el obtenido de los tejidos FFPE-RNA.
El uso de enfoques de secuenciación de próxima generación nos ha permitido obtener una gran cantidad de información de varios tipos de muestras. Sin embargo, las muestras antiguas y mal conservadas siguen siendo inviables para los métodos de uso común para generar datos de secuencia y a menudo requieren modificaciones en protocolos bien establecidos. Los tejidos FFPE representan un tipo de muestra que ha sido ampliamente utilizado para muestras clínicas1,2,3. Mientras que la preservación de FFPE mantiene la morfología tisular, los ácidos nucleicos en los tejidos FFPE generalmente exhiben una amplia gama de daño y degradación, lo que dificulta la recuperación de la información genómica que puede conducir a información importante sobre los mecanismos moleculares subyacentes a diversos trastornos.
Los datos de expresión génica generados por la secuenciación de ARN a menudo son fundamentales para estudiar los mecanismos de enfermedad y resistencia y complementan el análisis de mutaciones del ADN. Sin embargo, el ARN es más susceptible a la degradación, lo que hace más difícil generar datos precisos de expresión génica a partir de tejidos FFPE. Además, debido a que la amplia disponibilidad y asequibilidad de la secuenciación es relativamente reciente, los especímenes más antiguos a menudo no se almacenaban en condiciones necesarias para preservar la integridad del ARN. Algunos de los problemas de las muestras de FFPE incluyen la degradación del ARN debido a la incrustación en la parafina, la modificación química del ARN que conduce a la fragmentación o refractoridad a los procesos enzimáticos necesarios para la secuenciación, y la pérdida de las colas de poli-A, limitando la aplicabilidad del oligo-dT como imprimación para la transcriptasa inversa4. Otro desafío es la manipulación/almacenamiento de muestras de FFPE en condiciones subóptimas, lo que puede conducir a una mayor degradación de moléculas lábiles como el ARN en los tejidos5. Esto es especialmente relevante para muestras más antiguas que pueden haber sido recogidas en un momento en que no se anticipó el análisis de expresión génica mediante secuenciación de ARN para las muestras. Todo esto conduce a una menor calidad y cantidad del ARN extraído disponible para generar datos de secuencia útiles. La baja probabilidad de éxito, combinada con el alto costo de secuenciación, ha disuadido a muchos investigadores de tratar de generar y analizar datos de expresión génica a partir de muestras de FFPE potencialmente útiles. Algunos estudios realizados en los últimos años han demostrado la usabilidad de los tejidos FFPE para el análisis de expresión génica2,6,7,8,9, aunque para menos y / o muestras más recientes.
Como estudio de viabilidad, utilizamos ARN extraído de muestras de tejido tumoral FFPE de tres repositorios de tejidos residuales de registros de cáncer de vigilancia, epidemiología y resultados finales (SEER) para la secuenciación de ARN y el análisis de expresión génica10. Adquiridos en laboratorios de patología clínica, los tejidos FFPE de adenocarcinomas monovariesos ováricos de alto grado se almacenaron de 7 a 32 años en condiciones variables antes de la extracción de ARN. Debido a que en la mayoría de los casos estos bloques se habían almacenado en diferentes sitios durante años sin la expectativa de ningún análisis genético sensible en el futuro, no se había tenido mucho cuidado para preservar los ácidos nucleicos. Por lo tanto, la mayoría de las muestras exhibieron ARN de mala calidad, con una gran proporción de muestras contaminadas con bacterias. Sin embargo, pudimos realizar la cuantificación genética, medir la uniformidad y continuidad de la cobertura génica, y realizar el análisis de correlación de Pearson entre réplicas biológicas para medir la reproducibilidad. Basándonos en un conjunto de paneles genéticos de firma clave, comparamos las muestras de nuestro estudio con los datos de The Cancer Genome Atlas (TCGA) y confirmamos que aproximadamente el 60% de las muestras tenían perfiles de expresión génicacomparables 11. Basándonos en la correlación entre varios resultados de control de calidad y metadatos de ejemplo, identificamos métricas clave de control de calidad que tienen un buen valor predictivo para identificar muestras que son más propensas a generar datos de secuencia utilizables11.
Aquí describimos la metodología utilizada para la evaluación de la calidad del FFPE-ARN, la generación de bibliotecas de secuenciación a partir de muestras de ARN extraídos y el análisis bioinformático de los datos de secuenciación.
1. Evaluación de la cantidad y calidad del ARN
2. Preparación de la biblioteca de secuenciación
3. Secuenciación de la biblioteca QC
4. Secuenciación
5. Análisis de datos y evaluación de la calidad
NOTA: Un flujo de trabajo de análisis de datos típico de ARN-seq (Figura 1) incluye preprocesamiento y control de calidad, alineación con el genoma y la alineación posterior QC, cuantificación de genes y transcripciones, análisis de correlación de muestras, análisis diferencial entre diferentes grupos de muestras, condiciones de tratamiento y enriquecimiento de conjuntos genéticos y análisis de vías.
Los datos de ARN-seq pueden tener problemas de calidad que pueden afectar a la precisión del perfilado de genes y conducir a conclusiones erróneas. Por lo tanto, las comprobaciones iniciales de control de calidad para la secuenciación, la contaminación, el sesgo de cobertura de secuenciación y otras fuentes de artefactos son muy importantes. Se recomienda aplicar una canalización de QC de ARN-Seq similar al flujo de trabajo descrito aquí para detectar artefactos y aplicar filtrado o corrección antes del análisis posterior.
La metodología descrita anteriormente se aplicó a 67 muestras de FFPE que se habían almacenado en una variedad de condiciones diferentes durante 7 a 32 años (la mediana de tiempo de almacenamiento de muestras fue de 17,5 años). Los resultados del conjunto de datos y el análisis presentados aquí fueron descritos y publicados previamente en Zhao et al.11. Al comprobar la calidad de la muestra como se describió anteriormente (es decir, los seguimientos de ejemplo en la Fi...
El método descrito aquí describe los pasos principales necesarios para obtener buenos datos de secuencia de muestras de ARN FFPE. Los principales puntos a tener en cuenta con este método son: (1) Asegúrese de que el ARN se conserva lo mejor posible después de la extracción minimizando el manejo de la muestra y los ciclos de congelación y descongelación. Las alícuotas de control de calidad separadas son muy útiles. (2) Utilice una métrica de control de calidad que sea mejor para el conjunto de muestras dado. Lo...
Este trabajo fue financiado por el Instituto Nacional del Cáncer (NCI), Institutos Nacionales de Salud (NIH). Leidos Biomedical Research, Inc. es el contratista de operaciones y soporte técnico para el Laboratorio Nacional Frederick para la Investigación del Cáncer que está totalmente financiado por NIH. Varios autores (YZ, MM, KT, YL, JS, BT) están afiliados a Leidos Biomedical Research, Inc., pero todos los autores están totalmente financiados por el Instituto Nacional del Cáncer, incluidos los salarios de los autores y materiales de investigación. Leidos Biomedical Research, Inc. no proporcionó salario para los autores (YZ, MM, KT, YL, JS, BT) ni material para el estudio, ni tuvo ningún papel en el diseño del estudio, la recopilación de datos, el análisis, la decisión de publicar o la preparación del manuscrito.
Estamos agradecidos a la Dra. Danielle Carrick (División de Control del Cáncer y Ciencias de la Población, Instituto Nacional del Cáncer) por su ayuda continua, especialmente para iniciar este estudio, proporcionarnos las muestras, y por sugerencias útiles durante el análisis de datos. Agradecemos sinceramente a todos los miembros del Centro de Secuenciación de CCR en el Laboratorio Nacional Frederick para la Investigación del Cáncer por su ayuda durante la preparación y secuenciación de muestras, especialmente a Brenda Ho por su ayuda en la muestra de control de calidad, Oksana Alemán para la biblioteca QC, Tatyana Smirnova para ejecutar los secuenciadores. También nos gustaría agradecer a Tsai-wei Shen y Ashley Walton en Sequencing Facility Bioinformatics Group por ayudar con el análisis de datos y la implementación del oleoducto RNA-seq. También agradecemos a CCBR y NCBR por la asistencia con el desarrollo de la canalización de análisis de RNaseq y las mejores prácticas.
Name | Company | Catalog Number | Comments |
2100 Bioanalyzer | Agilent | G2939BA | |
Agilent DNA 7500 Kit | Agilent | 5067-1506 | |
Agilent High Sensitivity DNA Kit | Agilent | 5067-4626 | |
Agilent RNA 6000 Nano Kit | Agilent | 5067-1511 | |
AllPrep DNA/RNA FFPE Kit | Qiagen | 80234 | |
CFX96 Touch System | Bio-Rad | 1855195 | |
Library Quantification kit v2-Illumina | KapaBiosystems | KK4824 | |
NEBNext Ultra II Directional RNA Library Prep Kit for Illumina | New England Biolabs | E7765S | https://www.neb.com/protocols/2017/02/07/protocol-for-use-with-ffpe-rna-nebnext-rrna-depletion-kit |
NEBNext rRNA Depletion Kit (Human/Mouse/Rat) | New England Biolabs | E6310L | |
NextSeq 500 Sequencing System | Illumina | SY-415-1001 | NextSeq 500 System guide: https://support.illumina.com/content/dam/illumina-support/documents/documentation/system_documentation/nextseq/nextseq-500-system-guide-15046563-06.pdf |
NextSeq PhiX Control Kit | Illumina | FC-110-3002 | |
NSQ 500/550 Hi Output KT v2.5 (150 CYS) | Illumina | 20024907 | |
10X Genomics Magnetic Separator | 10X Genomics | 120250 | |
Rotator Multimixer | VWR | 13916-822 | |
C1000 Touch Thermal Cycler | Bio-Rad | 1851197 | |
Sequencing reagent kit | Illumina | 20024907 | |
Flow cell package | Illumina | 20024907 | |
Buffer cartridge and the reagent cartridge | Illumina | 20024907 | |
Sodium hydroxide solution (0.2N) | Millipore Sigma | SX0607D-6 | |
TRIS-HCL Buffer 1.0M, pH 7.0 | Fisher Scientific | 50-151-871 |
Solicitar permiso para reutilizar el texto o las figuras de este JoVE artículos
Solicitar permisoThis article has been published
Video Coming Soon
ACERCA DE JoVE
Copyright © 2025 MyJoVE Corporation. Todos los derechos reservados