Se requiere una suscripción a JoVE para ver este contenido. Inicie sesión o comience su prueba gratuita.
Aquí, presentamos un protocolo para convertir datos transcriptómicos en una vista mqTrans, lo que permite la identificación de biomarcadores oscuros. Si bien no se expresan diferencialmente en los análisis transcriptómicos convencionales, estos biomarcadores exhiben una expresión diferencial en la vista mqTrans. El enfoque sirve como una técnica complementaria a los métodos tradicionales, revelando biomarcadores que antes se pasaban por alto.
El transcriptoma representa los niveles de expresión de muchos genes en una muestra y se ha utilizado ampliamente en la investigación biológica y la práctica clínica. Por lo general, los investigadores se centraron en biomarcadores transcriptómicos con representaciones diferenciales entre un grupo fenotípico y un grupo de control de muestras. Este estudio presentó un marco de aprendizaje multitarea de la red de atención gráfica (GAT) para aprender las complejas interacciones intergénicas de las muestras de referencia. Se entrenó previamente un modelo de referencia demostrativo en las muestras sanas (HealthModel), que podría usarse directamente para generar la vista de regulación transcripcional cuantitativa basada en modelos (mqTrans) de los transcriptomas de prueba independientes. La vista mqTrans generada de los transcriptomas se demostró mediante tareas de predicción y detección de biomarcadores oscuros. El término acuñado "biomarcador oscuro" se deriva de su definición de que un biomarcador oscuro mostraba una representación diferencial en la vista mqTrans, pero no una expresión diferencial en su nivel de expresión original. Un biomarcador oscuro siempre se pasó por alto en los estudios tradicionales de detección de biomarcadores debido a la ausencia de expresión diferencial. El código fuente y el manual de la canalización HealthModelPipe se pueden descargar desde http://www.healthinformaticslab.org/supp/resources.php.
El transcriptoma consiste en la expresión de todos los genes en una muestra y puede ser perfilado por tecnologías de alto rendimiento como microarrays y RNA-seq1. Los niveles de expresión de un gen en un conjunto de datos se denominan característica transcriptómica, y la representación diferencial de una característica transcriptómica entre el fenotipo y los grupos control define a este gen como un biomarcador de este fenotipo 2,3. Los biomarcadores transcriptómicos se han utilizado ampliamente en las investigaciones del diagnóstico de enfermedades
NOTA: El siguiente protocolo describe los detalles del procedimiento analítico informático y los comandos de Python de los módulos principales. La Figura 2 ilustra los tres pasos principales con comandos de ejemplo utilizados en este protocolo y se refieren a los trabajos publicados anteriormente26,38 para obtener más detalles técnicos. Realice el siguiente protocolo en una cuenta de usuario normal en un sistema informático y evite usar la cuenta de administrador o raíz. Este es un protocolo computacional y no tiene factores biomédicos peligrosos.
Evaluación de la vista mqTrans del conjunto de datos transcriptómicos
El código de prueba utiliza once algoritmos de selección de características (FS) y siete clasificadores para evaluar cómo la vista mqTrans generada del conjunto de datos transcriptómicos contribuye a la tarea de clasificación (Figura 6). El conjunto de datos de prueba consta de 317 adenocarcinomas de colon (COAD) de la base de datos The Cancer Genome Atlas (TCGA)29. Los p.......
La sección 2 (Uso del modelo de salud previamente entrenado para generar las características de mqTrans) del protocolo es el paso más crítico dentro de este protocolo. Después de preparar el entorno de trabajo computacional en la sección 1, la sección 2 genera la vista mqTrans de un conjunto de datos transcriptómico basado en el modelo de referencia grande previamente entrenado. La sección 3 es un ejemplo demostrativo de la selección de las características mqTrans generadas para tareas de predicción y detecci.......
Los autores no tienen nada que revelar.
Este trabajo contó con el apoyo del Equipo de Innovación Tecnológica Senior y Junior (20210509055RQ), los Proyectos de Ciencia y Tecnología de la Provincia de Guizhou (ZK2023-297), la Fundación de Ciencia y Tecnología de la Comisión de Salud de la Provincia de Guizhou (gzwkj2023-565), el Proyecto de Ciencia y Tecnología del Departamento de Educación de la Provincia de Jilin (JJKH20220245KJ y JJKH20220226SK), la Fundación Nacional de Ciencias Naturales de China (U19A2061), el Laboratorio Clave Provincial de Jilin de Computación Inteligente de Big Data (20180622002JC), y los Fondos de Investigación Fundamental para las Universidades Centrales, JLU. Extendemos nuestro má....
Name | Company | Catalog Number | Comments |
Anaconda | Anaconda | version 2020.11 | Python programming platform |
Computer | N/A | N/A | Any general-purpose computers satisfy the requirement |
GPU card | N/A | N/A | Any general-purpose GPU cards with the CUDA computing library |
pytorch | Pytorch | version 1.13.1 | Software |
torch-geometric | Pytorch | version 2.2.0 | Software |
Solicitar permiso para reutilizar el texto o las figuras de este JoVE artículos
Solicitar permisoExplorar más artículos
This article has been published
Video Coming Soon
ACERCA DE JoVE
Copyright © 2025 MyJoVE Corporation. Todos los derechos reservados