JoVE Logo

Iniciar sesión

Se requiere una suscripción a JoVE para ver este contenido. Inicie sesión o comience su prueba gratuita.

En este artículo

  • Resumen
  • Resumen
  • Introducción
  • Protocolo
  • Resultados
  • Discusión
  • Divulgaciones
  • Agradecimientos
  • Materiales
  • Referencias
  • Reimpresiones y Permisos

Resumen

Este método describe los pasos para mejorar la calidad y la cantidad de datos de secuencia que se pueden obtener a partir de muestras de ARN incrustadas de parafina fija de formalina (FFPE). Describimos la metodología para evaluar con mayor precisión la calidad de las muestras de FFPE-RNA, preparar bibliotecas de secuenciación y analizar los datos de muestras de ARN FFPE.

Resumen

El análisis de la expresión génica mediante la secuenciación de ARN (RNA-seq) permite obtener información única sobre muestras clínicas que pueden conducir potencialmente a una comprensión mecanicista de la base de diversas enfermedades, así como mecanismos de resistencia y/o susceptibilidad. Sin embargo, los tejidos FFPE, que representan el método más común para preservar la morfología tisular en muestras clínicas, no son las mejores fuentes para el análisis de perfiles de expresión génica. El ARN obtenido de tales muestras a menudo se degrada, fragmenta y se modifica químicamente, lo que conduce a bibliotecas de secuenciación subóptimas. A su vez, estos generan datos de secuencia de mala calidad que pueden no ser confiables para el análisis de expresión génica y el descubrimiento de mutaciones. Con el fin de aprovechar al máximo las muestras de FFPE y obtener los mejores datos posibles de muestras de baja calidad, es importante tomar ciertas precauciones mientras se planifica el diseño experimental, se preparan bibliotecas de secuenciación y durante el análisis de datos. Esto incluye el uso de métricas adecuadas para un control preciso de la calidad de la muestra (QC), la identificación de los mejores métodos para varios pasos durante la generación de la biblioteca de secuenciación y el control de calidad cuidadoso de la biblioteca. Además, la aplicación de herramientas y parámetros de software correctos para el análisis de datos de secuencia es fundamental para identificar artefactos en los datos de ARN-seq, filtrar la contaminación y lecturas de baja calidad, evaluar la uniformidad de la cobertura génica y medir la reproducibilidad de los perfiles de expresión génica entre réplicas biológicas. Estos pasos pueden garantizar una alta precisión y reproducibilidad para el perfilado de muestras de ARN muy heterogéneas. Aquí describimos los diversos pasos para el control de calidad de la muestra, la preparación de la biblioteca y el control de calidad, la secuenciación y el análisis de datos que pueden ayudar a aumentar la cantidad de datos útiles obtenidos de ARN de baja calidad, como el obtenido de los tejidos FFPE-RNA.

Introducción

El uso de enfoques de secuenciación de próxima generación nos ha permitido obtener una gran cantidad de información de varios tipos de muestras. Sin embargo, las muestras antiguas y mal conservadas siguen siendo inviables para los métodos de uso común para generar datos de secuencia y a menudo requieren modificaciones en protocolos bien establecidos. Los tejidos FFPE representan un tipo de muestra que ha sido ampliamente utilizado para muestras clínicas1,2,3. Mientras que la preservación de FFPE mantiene la morfología tisular, los ácidos nucleicos en los tejidos FFPE generalmente exhiben una amplia gama de daño y degradación, lo que dificulta la recuperación de la información genómica que puede conducir a información importante sobre los mecanismos moleculares subyacentes a diversos trastornos.

Los datos de expresión génica generados por la secuenciación de ARN a menudo son fundamentales para estudiar los mecanismos de enfermedad y resistencia y complementan el análisis de mutaciones del ADN. Sin embargo, el ARN es más susceptible a la degradación, lo que hace más difícil generar datos precisos de expresión génica a partir de tejidos FFPE. Además, debido a que la amplia disponibilidad y asequibilidad de la secuenciación es relativamente reciente, los especímenes más antiguos a menudo no se almacenaban en condiciones necesarias para preservar la integridad del ARN. Algunos de los problemas de las muestras de FFPE incluyen la degradación del ARN debido a la incrustación en la parafina, la modificación química del ARN que conduce a la fragmentación o refractoridad a los procesos enzimáticos necesarios para la secuenciación, y la pérdida de las colas de poli-A, limitando la aplicabilidad del oligo-dT como imprimación para la transcriptasa inversa4. Otro desafío es la manipulación/almacenamiento de muestras de FFPE en condiciones subóptimas, lo que puede conducir a una mayor degradación de moléculas lábiles como el ARN en los tejidos5. Esto es especialmente relevante para muestras más antiguas que pueden haber sido recogidas en un momento en que no se anticipó el análisis de expresión génica mediante secuenciación de ARN para las muestras. Todo esto conduce a una menor calidad y cantidad del ARN extraído disponible para generar datos de secuencia útiles. La baja probabilidad de éxito, combinada con el alto costo de secuenciación, ha disuadido a muchos investigadores de tratar de generar y analizar datos de expresión génica a partir de muestras de FFPE potencialmente útiles. Algunos estudios realizados en los últimos años han demostrado la usabilidad de los tejidos FFPE para el análisis de expresión génica2,6,7,8,9, aunque para menos y / o muestras más recientes.

Como estudio de viabilidad, utilizamos ARN extraído de muestras de tejido tumoral FFPE de tres repositorios de tejidos residuales de registros de cáncer de vigilancia, epidemiología y resultados finales (SEER) para la secuenciación de ARN y el análisis de expresión génica10. Adquiridos en laboratorios de patología clínica, los tejidos FFPE de adenocarcinomas monovariesos ováricos de alto grado se almacenaron de 7 a 32 años en condiciones variables antes de la extracción de ARN. Debido a que en la mayoría de los casos estos bloques se habían almacenado en diferentes sitios durante años sin la expectativa de ningún análisis genético sensible en el futuro, no se había tenido mucho cuidado para preservar los ácidos nucleicos. Por lo tanto, la mayoría de las muestras exhibieron ARN de mala calidad, con una gran proporción de muestras contaminadas con bacterias. Sin embargo, pudimos realizar la cuantificación genética, medir la uniformidad y continuidad de la cobertura génica, y realizar el análisis de correlación de Pearson entre réplicas biológicas para medir la reproducibilidad. Basándonos en un conjunto de paneles genéticos de firma clave, comparamos las muestras de nuestro estudio con los datos de The Cancer Genome Atlas (TCGA) y confirmamos que aproximadamente el 60% de las muestras tenían perfiles de expresión génicacomparables 11. Basándonos en la correlación entre varios resultados de control de calidad y metadatos de ejemplo, identificamos métricas clave de control de calidad que tienen un buen valor predictivo para identificar muestras que son más propensas a generar datos de secuencia utilizables11.

Aquí describimos la metodología utilizada para la evaluación de la calidad del FFPE-ARN, la generación de bibliotecas de secuenciación a partir de muestras de ARN extraídos y el análisis bioinformático de los datos de secuenciación.

Protocolo

1. Evaluación de la cantidad y calidad del ARN

  1. Seleccione las muestras FFPE según criterios predefinidos y extraiga el ARN utilizando un método adecuado (por ejemplo, kit de extracción de ácido FFPE-nuclei, Tabla de materiales).
    NOTA: Hay varios métodos diferentes disponibles para la extracción de ARN FFPE, incluyendo los nuevos métodos de microdisección que pueden trabajar con muy poco tejido y extraer ARN12,13,,14de buena calidad.,
  2. Se debe tener el máximo cuidado de preservar la integridad del ARN en todas las etapas. Esto incluye trabajar con agua desionizada libre de RNase, usar plastificería libre de RNase y limpiar todos los instrumentos que entren en contacto con los bloques FFPE con reactivos de descontaminación RNase.
  3. El ARN siempre debe manipularse con cuidado y mantenerse en hielo a menos que se especifique lo contrario para minimizar la degradación durante el manejo.
  4. Si hay suficiente material disponible, extraiga ARN de más de una región en el bloque FFPE para generar réplicas biológicas a partir de tantas muestras como sea posible. Para algunas de las muestras con un amplio rendimiento de ARN, divida el ARN extraído en dos para procesarlo como réplicas técnicas.
  5. Si es posible, recoja una pequeña cantidad de muestra por separado después de la extracción de QC (es decir, una alícuota de control de calidad) para evitar la manipulación repetida y los ciclos de congelación y descongelación de la muestra que probablemente conducirán a la degradación del ARN.
  6. Compruebe la calidad del ARN (preferiblemente de la alícuota QC) ejecutándolo en un sistema de ARN QC (por ejemplo, el sistema Agilent Bioanalyzer utilizando un chip RNA Nano, Tabla de materiales) deacuerdo con las instrucciones del fabricante.
  7. Analice la distribución de fragmentos de ARN en las muestras (por ejemplo, utilizando el software Bioanalyzer 2100 Expert) calculando los valores DV200 y DV100 como el porcentaje de fragmentos de más de 200 nt (DV200) o 100 nt (DV100) en tamaño.
  8. Entre DV200 y DV100, identificar la métrica que tiene una mayor dispersión de valores para el conjunto de muestras dado, y elegir eso para agrupar las muestras de acuerdo con su grado de intacta.
    NOTA: Para conjuntos de muestras con moléculas de ARN más intactas (es decir, valores DV200 altos, todos o la mayoría con DV200 > 40%), DV200 es probable que sea una métrica de control de calidad útil. Sin embargo, para conjuntos de muestras con transcripciones más degradadas (es decir, valores DV200 bajos, todos o la mayoría con DV200 < 40%), DV100 es más probable que sea útil.
  9. En función de las métricas de control de calidad, identifique las muestras que tienen DV100 < 40%. Debido a que es muy probable que este grado de degradación no genere datos de secuenciación útiles11,es aconsejable evitar el procesamiento de dichas muestras. Si hay reemplazos para tales muestras disponibles, su calidad debe comprobarse para incluir idealmente solo muestras con DV100 > 50%.

2. Preparación de la biblioteca de secuenciación

  1. Sobre la base de la calidad de las muestras evaluadas en la sección 1, identifique un método adecuado para generar las bibliotecas de secuenciación.
    1. Para conjuntos de muestras con muy baja degradación y valores DV200 altos, utilice la secuenciación de ARNm (es decir, captura de transcripciones poliadeniladas), secuenciación de ARN dirigida (es decir, uso de sondas de captura para genes específicos de interés), secuenciación de exomas de ARN (es decir, uso de sondas de captura para enriquecer para el transcriptoma de codificación) o secuenciación total de ARN (es decir, uso de imprimaciones aleatorias para la transcripción inversa para secuenciar toda la población de ARN después de eliminar la eliminación de la población ribomal de las muestras). Sin embargo, es importante tener en cuenta que el proceso de fijación puede introducir sesgo en el ARN extraído. Por lo tanto, los enfoques de captura pueden no funcionar bien en todos los casos, incluso con valores DV200 altos.
    2. Si el conjunto de muestras incluye muestras con alta degradación (DV200 < 30%), utilice un método total de preparación de la biblioteca de ARN y no uno que dependa de la captura de regiones específicas de las transcripciones, ya que esas regiones específicas pueden faltar en muestras degradadas. El uso de imprimaciones aleatorias para la generación de ADNc conduce a una mayor representación del ARN utilizable en la biblioteca final y, por lo tanto, es más adecuado para muestras de ARN FFPE.
    3. Para el agotamiento del ARN ribosomal para conjuntos de muestras con alta degradación, utilice métodos basados en RNaseH. Estos son métodos en los que las sondas de ADN específicas del ARNR se unen al ARNr, las moléculas de doble cadena son digeridas por RNaseH, y las sondas sobrantes son limpiadas por DNase (por ejemplo, kit de agotamiento de ARNN NEBNext, Tabla de materiales). Estos métodos funcionan mejor para muestras degradadas que algunos otros métodos8.
  2. Para generar bibliotecas de secuenciación, utilice cantidades de entrada más altas (si es posible) para muestras que tengan ARN más degradado (DV100 < 60%). Mientras que las muestras con ARN de calidad razonable (DV100 > 60%) puede producir buenos datos de secuencia incluso en cantidades de entrada más bajas (la prueba más baja para este protocolo con ARN FFPE fue de 20 ng), para ARN más degradado (DV100 < 60%), es mejor comenzar con cantidades de entrada más altas (por ejemplo, >100 ng).
    NOTA: Si hay suficiente (por ejemplo, >500 ng) de muestra disponible, es aconsejable guardar al menos la mitad de la muestra para repetir la preparación de la biblioteca, si es necesario. Para muestras de entrada baja (por ejemplo, <100 ng), normalmente es mejor utilizar toda la cantidad y generar una biblioteca de suficiente diversidad.
  3. Después de seleccionar un kit de preparación de biblioteca adecuado para generar bibliotecas de RNA seq totales a partir de muestras con alta degradación (por ejemplo, NEBNext Ultra II RNA Library Prep Kit for Illumina, ver Tabla de materiales), siga las instrucciones del fabricante para generar las bibliotecas.
    NOTA: Durante la preparación de la biblioteca, es importante omitir el paso de fragmentación del ARN para muestras degradadas y asegurar el uso de imprimaciones aleatorias para la síntesis de ADNc de primera hebra.
  4. Para mejorar la eficiencia y la velocidad, especialmente para las muestras de baja entrada, utilice bastidores magnéticos apropiados con imanes fijos fuertes para la purificación basada en cuentas y los pasos de selección de tamaño (ver Tabla de materiales).
  5. Para el enriquecimiento de PCR del ADN ligado adaptador, ajuste el número de ciclos de amplificación en función de la cantidad de ADN de entrada para garantizar la máxima representación evitando la duplicación innecesaria de las moléculas de la biblioteca. Para muestras de ARN FFPE de baja entrada (<100 ng), recomendamos 16–18 ciclos de amplificación, mientras que las muestras de entrada alta (1.000 ng) suelen generar suficientes cantidades de biblioteca en 12-14 rondas de amplificación.
  6. Después de la amplificación y limpieza de PCR según las instrucciones del fabricante, evalúe la calidad de la biblioteca mediante el análisis de la concentración de la biblioteca y la distribución de moléculas en una plataforma adecuada (por ejemplo, Agilent Bioanalyzer DNA Chip, ver Tabla de materiales). Para muestras con picos de imprimación (80 bp) o picos de adaptador-dimer (128 bp), repita la limpieza para eliminar esos picos.
  7. Calcule el tamaño medio de la biblioteca para cada biblioteca (por ejemplo, utilizando el software Bioanalyzer 2100 Expert).

3. Secuenciación de la biblioteca QC

  1. Una vez comprobado que las bibliotecas están libres de exceso de imprimación y adaptador-dimers y tienen suficiente concentración para la secuenciación posterior, cantidad adicional por qPCR.
    NOTA: Debido a la sensibilidad de la generación de racimos hacia la concentración de la biblioteca, la cuantificación precisa es vital para evitar que las costosas ejecuciones de secuenciación se vean con un bajo rendimiento o una sobrecarga. Los métodos cuantitativos de PCR en tiempo real (qPCR) son útiles para mejorar la densidad de clústeres en plataformas Illumina sin dar lugar a sobreclustering. El método qPCR es más preciso y más sensible que los métodos basados en el análisis cualitativo y/o cuantitativo de todas las moléculas de la biblioteca (por ejemplo, Agilent Bioanalyzer), ya que mide las plantillas que tienen ambas secuencias de adaptadores en cada extremo que formarán clústeres en la célula de flujo. Sin embargo, el tamaño de la biblioteca debe conocerse de antemano, ya que se debe aplicar una corrección de tamaño a todas las muestras para que los resultados se puedan comparar con una curva estándar.
    ADVERTENCIA: Los abrigos y guantes de laboratorio siempre deben usarse al realizar qPCR, y el procedimiento debe realizarse en un gabinete de bioseguridad siguiendo las instrucciones del fabricante.
    1. Configure una placa de 96 pozos con tres réplicas para cada muestra para la prevención de errores utilizando un kit adecuado (por ejemplo, KAPA SYBR FAST qPCR Master Mix for Illumina libraries, una parte del kit de cuantificación de bibliotecas, véase Tabla de materiales),junto con los estándares, un control positivo (por ejemplo, control PhiX, véase Tabla de materiales)y un control sin plantilla (NTC). El NTC es qPCR mezcla sin biblioteca de ADN. El control positivo puede ser cualquier biblioteca con concentración conocida y tamaño de fragmento.
      1. Prepare un mínimo de seis diluciones de los estándares siguiendo el protocolo de proveedor.
    2. Después de añadir todos los componentes (es decir, mezcla maestra qPCR, bibliotecas, estándares), cubra la placa con película de sellado y utilice una escobilla para asegurarse de que la película hace contacto uniforme y seguro con la placa.
    3. Vórtice y gire hacia abajo la placa a 1.500 rpm durante al menos 1 min. Inspeccione visualmente la placa para asegurarse de que no haya burbujas de aire en la parte inferior de los pozos.
    4. Configure la placa en el ciclor térmico (por ejemplo, CFX96 Touch System, consulte Tabla de materiales) utilizando los ajustes recomendados por el fabricante.
    5. Guarde la carpeta de ejecución a la que se puede acceder para el análisis de datos.
    6. Durante el análisis de datos, compruebe que la pendiente está en el rango de -3,1 a -3,6, la eficiencia del 90% al 110% y la R2 (coeficiente de correlación obtenida para la curva estándar) no inferior a 0,98.
  2. Agrupación: Una vez que se obtiene la concentración qPCR de las bibliotecas listas para secuenciación, la agrupación de cantidades equimolares de cada una de las bibliotecas, dependiendo del número de lecturas de secuenciación requeridas por muestra y la salida de secuenciación del instrumento.
  3. QC de las agrupaciones: Cantidadar las agrupaciones de bibliotecas de nuevo por qPCR siguiendo el mismo protocolo como se describe en el paso 3.1.

4. Secuenciación

  1. Dependiendo de los parámetros de ejecución, tire de los kits de secuenciación de reactivos y descongelarlos siguiendo la guía del usuario. Consulte el sitio web de Illumina para ver las últimas versiones de todas las guías de usuario para la secuenciación de instrumentos Illumina.
  2. Asegúrese de que los reactivos estén completamente descongelados y coloque la bandeja de reactivos a 4 oC. La carrera debe iniciarse a más tardar 2 h después de que los reactivos se hayan descongelado. No hacerlo podría afectar a la calidad de los resultados de la ejecución.
  3. Invierta el cartucho 5x para mezclar reactivos y toque suavemente en el banco para reducir las burbujas de aire.
  4. Deje el paquete de celda de flujo sin envolver a temperatura ambiente durante 30 min.
  5. Desenvuelva el paquete de celda de flujo y limpie la superficie de vidrio de la celda de flujo con una toallita de alcohol sin pelusas. Seque el vaso con un tejido de laboratorio de baja pelusa.
  6. Abra la aplicación Illumina "Experiment Manager". Elija "Crear hoja de muestra", a continuación, elija el secuenciador y haga clic en "Siguiente".
  7. Cree y cargue la hoja de muestra en función de los criterios del secuenciador de Illumina (por ejemplo, Illumina Experiment Manager, guía de software).
  8. En las indicaciones, escanee en el código de barras del kit de reactivos e introduzca la ejecución de parámetros de configuración (por ejemplo, para una única ejecución de ciclo PE 75 indexada, escriba 76-8-76).
  9. Desnaturalizar y diluir el grupo de bibliotecas en función de la recomendación de la guía del usuario del secuenciador (por ejemplo, NextSeq 500 System guide from Illumina, ver Tabla de materiales).
  10. Desnaturalizar y diluir la biblioteca de control PhiX (ver Tabla de materiales)a la concentración adecuada (por ejemplo, 1,8 pM para NextSeq).
  11. Mezcle la biblioteca de muestras y el control PhiX para dar como resultado una relación de volumen de control PhiX del 1%.
  12. Cargue la muestra desnaturalada y diluida en el cartucho de reactivo en el depósito designado.
  13. Cargue la celda de flujo, el cartucho de búfer y el cartucho de reactivo.
  14. Realice una comprobación y revisión automatizadas para asegurarse de que los parámetros de ejecución pasan la comprobación del sistema.
  15. Una vez completada la comprobación automatizada, seleccione Iniciar para iniciar la ejecución de secuenciación.

5. Análisis de datos y evaluación de la calidad

NOTA: Un flujo de trabajo de análisis de datos típico de ARN-seq (Figura 1) incluye preprocesamiento y control de calidad, alineación con el genoma y la alineación posterior QC, cuantificación de genes y transcripciones, análisis de correlación de muestras, análisis diferencial entre diferentes grupos de muestras, condiciones de tratamiento y enriquecimiento de conjuntos genéticos y análisis de vías.

Los datos de ARN-seq pueden tener problemas de calidad que pueden afectar a la precisión del perfilado de genes y conducir a conclusiones erróneas. Por lo tanto, las comprobaciones iniciales de control de calidad para la secuenciación, la contaminación, el sesgo de cobertura de secuenciación y otras fuentes de artefactos son muy importantes. Se recomienda aplicar una canalización de QC de ARN-Seq similar al flujo de trabajo descrito aquí para detectar artefactos y aplicar filtrado o corrección antes del análisis posterior.

  1. Preprocesamiento
    NOTA: Esto incluye desmultiplexación, evaluación de la calidad de lectura de secuencia, contenido de GC, presencia de adaptadores de secuenciación, k-mers sobrerrepresentados y lecturas duplicadas de PCR. Esta información ayuda a detectar errores de secuenciación, artefactos de PCR o contaminación.
    1. La secuenciación de Demultiplex Illumina se ejecuta utilizando la herramienta de software Illumina bcl2fastq2 para generar archivos FASTQ sin procesar para cada muestra definida en la hoja de muestra. Permita que una discordancia en los códigos de barras del índice de muestra tolere errores de secuenciación si no hay colisión de código de barras.
    2. Ejecute la herramienta de software FASTQC15 para realizar una comprobación de calidad en archivos FASTQ sin procesar para detectar cualquier mala calidad o anomalías en las lecturas de secuenciación.
    3. Para el recorte de bases de adaptador y baja calidad, recorte los adaptadores de secuenciación y las bases de baja calidad con herramientas de software Cutadapt16 o Trimmomatic17. Guarde las lecturas recortadas en los archivos fastq del par.
    4. Pantalla de contaminación
      1. Ejecute FASTQ_screen18 para detectar una posible contaminación cruzada con otras especies.
      2. Ejecute miniKraken de Kraken219 para identificar las taxonomías de las especies contaminantes.
  2. Alineación con el genoma de referencia y el control de calidad posterior a la alineación
    1. Las lecturas recortadas se pueden alinear con una secuencia del genoma de referencia (GRCh Build hg19 o hg38) utilizando el alineador STAR20. Aplique el archivo GTF de anotación Gencode para guiar la alineación de transcripción empalmada. Se recomienda ejecutar STAR 2-pass para aumentar la sensibilidad a nuevas uniones de empalme. En el segundo paso, todas las lecturas serán reasignadas usando genes anotados y transcripciones y nuevos cruces desde el primer paso.
    2. Realice el control de calidad posterior a la alineación.
      1. Ejecute21MarkDuplicates de Picard para evaluar la complejidad de la biblioteca determinando la cantidad de lecturas únicas o no duplicadas en los ejemplos.
      2. Ejecute el programa CollectRnaSeqMetrics de Picard para recopilar porcentajes de mapeo sobre la codificación, las regiones intrónicas, intergénicas, las regiones UTR y la cobertura del cuerpo del gen.
      3. Ejecute RSeQC22 para determinar la distancia interna del par de lectura, la distribución de lectura entre exones CDS, 5'UTR, 3'UTR, intron, TSS_up_1kb, TSS_up_5kb, TSS_up_10kb, TES_down_1kb, TES_down_5kb, TES_down_10kb, leer contenido de GC, saturación de cruces e información de hilo de biblioteca.
      4. Ejecute multi-QC23 para generar un informe agregado en formato HTML.
  3. Análisis de cuantificación y corrección de genes
    1. Ejecute RSEM24 para obtener recuento bruto, así como recuento de lectura normalizado en genes y transcripciones. La medición del recuento de lecturas, como RPKM (lecturas por kilobase del modelo exón por millón de lecturas), FPKM (fragmentos por kilobase del modelo exón por millón de lecturas asignadas) y TPM (transcripciones por millón) son los valores de expresión del gen arn-seq notificados con mayor frecuencia. Los genes expresados por debajo de un umbral noizado (como TPM < 1 o recuento sin procesar <5) se pueden filtrar.
    2. Realice la cuantificación de transcripciones para agregar recuentos sin procesar de lecturas asignadas a cada secuencia de transcripción mediante programas como HTSeq-count o featureCounts.
    3. Ejecute Análisis de componentes principales (PCA) mediante un script de R para determinar los efectos por lotes y evaluar un mapa de calidad del conjunto de datosespecificado 25. El análisis de correlación de muestras se puede llevar a cabo utilizando la correlación de Pearson entre diferentes métricas.
  4. Análisis de expresión génica diferencial
    1. Realizar análisis diferenciales genéticos entre las condiciones de la muestra utilizando el programa edgeR26,27 y/o limma-Voom28 y utilizar métodos de normalización como TPM, TMM, DESeqo UpperQuartile.
    2. Se recomienda ejecutar al menos dos herramientas de software de análisis diferencial para llamar a dos conjuntos de listas de DEG para la comparación y obtener los DEG finales para mejorar la sensibilidad y precisión de la detección.
  5. Enriquecimiento de conjuntos genéticos y análisis de caminos
    1. Realizar análisis de enriquecimiento de conjuntos genéticos (GSEA)29,30 basado en la clasificación de las transcripciones de acuerdo con una lista de medición de genes expresados diferencialmente (DEG) para determinar si los DEG muestran diferencias concordantes estadísticamente significativas entre las condiciones biológicas.
    2. Realice análisis de funciones utilizando recursos como Gene Ontology31, DAVID32,,33u otras herramientas de software disponibles.

Resultados

La metodología descrita anteriormente se aplicó a 67 muestras de FFPE que se habían almacenado en una variedad de condiciones diferentes durante 7 a 32 años (la mediana de tiempo de almacenamiento de muestras fue de 17,5 años). Los resultados del conjunto de datos y el análisis presentados aquí fueron descritos y publicados previamente en Zhao et al.11. Al comprobar la calidad de la muestra como se describió anteriormente (es decir, los seguimientos de ejemplo en la Fi...

Discusión

El método descrito aquí describe los pasos principales necesarios para obtener buenos datos de secuencia de muestras de ARN FFPE. Los principales puntos a tener en cuenta con este método son: (1) Asegúrese de que el ARN se conserva lo mejor posible después de la extracción minimizando el manejo de la muestra y los ciclos de congelación y descongelación. Las alícuotas de control de calidad separadas son muy útiles. (2) Utilice una métrica de control de calidad que sea mejor para el conjunto de muestras dado. Lo...

Divulgaciones

Este trabajo fue financiado por el Instituto Nacional del Cáncer (NCI), Institutos Nacionales de Salud (NIH). Leidos Biomedical Research, Inc. es el contratista de operaciones y soporte técnico para el Laboratorio Nacional Frederick para la Investigación del Cáncer que está totalmente financiado por NIH. Varios autores (YZ, MM, KT, YL, JS, BT) están afiliados a Leidos Biomedical Research, Inc., pero todos los autores están totalmente financiados por el Instituto Nacional del Cáncer, incluidos los salarios de los autores y materiales de investigación. Leidos Biomedical Research, Inc. no proporcionó salario para los autores (YZ, MM, KT, YL, JS, BT) ni material para el estudio, ni tuvo ningún papel en el diseño del estudio, la recopilación de datos, el análisis, la decisión de publicar o la preparación del manuscrito.

Agradecimientos

Estamos agradecidos a la Dra. Danielle Carrick (División de Control del Cáncer y Ciencias de la Población, Instituto Nacional del Cáncer) por su ayuda continua, especialmente para iniciar este estudio, proporcionarnos las muestras, y por sugerencias útiles durante el análisis de datos. Agradecemos sinceramente a todos los miembros del Centro de Secuenciación de CCR en el Laboratorio Nacional Frederick para la Investigación del Cáncer por su ayuda durante la preparación y secuenciación de muestras, especialmente a Brenda Ho por su ayuda en la muestra de control de calidad, Oksana Alemán para la biblioteca QC, Tatyana Smirnova para ejecutar los secuenciadores. También nos gustaría agradecer a Tsai-wei Shen y Ashley Walton en Sequencing Facility Bioinformatics Group por ayudar con el análisis de datos y la implementación del oleoducto RNA-seq. También agradecemos a CCBR y NCBR por la asistencia con el desarrollo de la canalización de análisis de RNaseq y las mejores prácticas.

Materiales

NameCompanyCatalog NumberComments
2100 BioanalyzerAgilentG2939BA
Agilent DNA 7500 KitAgilent5067-1506
Agilent High Sensitivity DNA KitAgilent5067-4626
Agilent RNA 6000 Nano KitAgilent5067-1511
AllPrep DNA/RNA FFPE KitQiagen80234
CFX96 Touch SystemBio-Rad1855195
Library Quantification kit v2-IlluminaKapaBiosystemsKK4824
NEBNext Ultra II Directional RNA Library Prep Kit for IlluminaNew England BiolabsE7765Shttps://www.neb.com/protocols/2017/02/07/protocol-for-use-with-ffpe-rna-nebnext-rrna-depletion-kit
NEBNext rRNA Depletion Kit (Human/Mouse/Rat)New England BiolabsE6310L
NextSeq 500 Sequencing SystemIlluminaSY-415-1001NextSeq 500 System guide: https://support.illumina.com/content/dam/illumina-support/documents/documentation/system_documentation/nextseq/nextseq-500-system-guide-15046563-06.pdf
NextSeq PhiX Control KitIlluminaFC-110-3002
NSQ 500/550 Hi Output KT v2.5 (150 CYS)Illumina20024907
10X Genomics Magnetic Separator10X Genomics120250
Rotator MultimixerVWR13916-822
C1000 Touch Thermal CyclerBio-Rad1851197
Sequencing reagent kitIllumina20024907
Flow cell packageIllumina20024907
Buffer cartridge and the reagent cartridgeIllumina20024907
Sodium hydroxide solution (0.2N)Millipore SigmaSX0607D-6
TRIS-HCL Buffer 1.0M, pH 7.0Fisher Scientific50-151-871

Referencias

  1. Carrick, D. M., et al. Robustness of Next Generation Sequencing on Older Formalin-Fixed Paraffin-Embedded Tissue. PLoS One. 10 (7), 0127353 (2015).
  2. Hedegaard, J., et al. Next-generation sequencing of RNA and DNA isolated from paired fresh-frozen and formalin-fixed paraffin-embedded samples of human cancer and normal tissue. PLoS One. 9 (5), 98187 (2014).
  3. Zhang, P., Lehmann, B. D., Shyr, Y., Guo, Y. The Utilization of Formalin Fixed-Paraffin-Embedded Specimens in High Throughput Genomic Studies. International Journal of Genomics. 2017, 1926304 (2017).
  4. Srinivasan, M., Sedmak, D., Jewell, S. Effect of fixatives and tissue processing on the content and integrity of nucleic acids. American Journal of Pathology. 161 (6), 1961-1971 (2002).
  5. von Ahlfen, S., Missel, A., Bendrat, K., Schlumpberger, M. Determinants of RNA quality from FFPE samples. PLoS One. 2 (12), 1261 (2007).
  6. Esteve-Codina, A., et al. A Comparison of RNA-Seq Results from Paired Formalin-Fixed Paraffin-Embedded and Fresh-Frozen Glioblastoma Tissue Samples. PLoS One. 12 (1), 0170632 (2017).
  7. Vukmirovic, M., et al. Identification and validation of differentially expressed transcripts by RNA-sequencing of formalin-fixed, paraffin-embedded (FFPE) lung tissue from patients with Idiopathic Pulmonary Fibrosis. BMC Pulmonary Medicine. 17 (1), 15 (2017).
  8. Adiconis, X., et al. Comparative analysis of RNA sequencing methods for degraded or low-input samples. Nature Methods. 10 (7), 623-629 (2013).
  9. Sinicropi, D., et al. Whole transcriptome RNA-Seq analysis of breast cancer recurrence risk using formalin-fixed paraffin-embedded tumor tissue. PLoS One. 7 (7), 40092 (2012).
  10. Altekruse, S. F., et al. SEER cancer registry biospecimen research: yesterday and tomorrow. Cancer Epidemiology, Biomarkers & Prevention. 23 (12), 2681-2687 (2014).
  11. Zhao, Y., et al. Robustness of RNA sequencing on older formalin-fixed paraffin-embedded tissue from high-grade ovarian serous adenocarcinomas. PLoS One. 14 (5), 0216050 (2019).
  12. Amini, P., et al. An optimised protocol for isolation of RNA from small sections of laser-capture microdissected FFPE tissue amenable for next-generation sequencing. BMC Molecular Biology. 18 (1), 22 (2017).
  13. Amini, P., Nassiri, S., Ettlin, J., Malbon, A., Markkanen, E. Next-generation RNA sequencing of FFPE subsections reveals highly conserved stromal reprogramming between canine and human mammary carcinoma. Disease Models and Mechanisms. 12 (8), (2019).
  14. Wimmer, I., et al. Systematic evaluation of RNA quality, microarray data reliability and pathway analysis in fresh, fresh frozen and formalin-fixed paraffin-embedded tissue samples. Scientific Reports. 8 (1), 6351 (2018).
  15. . Babraham Bioinformatics Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2019)
  16. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10-12 (2011).
  17. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  18. . Babraham Bioinformatics Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastq_screen/ (2019)
  19. Wood, D. E., Salzberg, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Genome Biology. 15 (3), 46 (2014).
  20. Dobin, A., et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 29 (1), 15-21 (2013).
  21. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  22. Ewels, P., Magnusson, M., Lundin, S., Kaller, M. MultiQC: summarize analysis results for multiple tools and samples in a single report. Bioinformatics. 32 (19), 3047-3048 (2016).
  23. Li, B., Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC Bioinformatics. 12, 323 (2011).
  24. Son, K., Yu, S., Shin, W., Han, K., Kang, K. A Simple Guideline to Assess the Characteristics of RNA-Seq Data. BioMed Research International. 2018, 2906292 (2018).
  25. McCarthy, D. J., Chen, Y., Smyth, G. K. Differential expression analysis of multifactor RNA-Seq experiments with respect to biological variation. Nucleic Acids Research. 40 (10), 4288-4297 (2012).
  26. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  27. Ritchie, M. E., et al. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Research. 43 (7), 47 (2015).
  28. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America U S A. 102 (43), 15545-15550 (2005).
  29. Mootha, V. K., et al. PGC-1alpha-responsive genes involved in oxidative phosphorylation are coordinately downregulated in human diabetes. Nature Genetics. 34 (3), 267-273 (2003).
  30. Ashburner, M., et al. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nature Genetics. 25 (1), 25-29 (2000).
  31. Huang da, W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature Protocols. 4 (1), 44-57 (2009).
  32. Huang da, W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Research. 37 (1), 1-13 (2009).
  33. Evaluating RNA Quality from FFPE Samples. Illumina Available from: https://www.illumina.com/content/dam/illumina-marketing/documents/products/technotes/evaluating-rna-quality-from-ffpe-samples-technical-note-470-2014-001.pdf (2016)

Reimpresiones y Permisos

Solicitar permiso para reutilizar el texto o las figuras de este JoVE artículos

Solicitar permiso

Explorar más artículos

Gen ticaN mero 160Secuenciaci n de ARNparafina fija en formalina incrustadaFFPEsecuenciaci n de pr xima generaci nNGSan lisis de ARN seq

This article has been published

Video Coming Soon

JoVE Logo

Privacidad

Condiciones de uso

Políticas

Investigación

Educación

ACERCA DE JoVE

Copyright © 2025 MyJoVE Corporation. Todos los derechos reservados