CorExplorer encuentra factores de expresión génica asociados al tumor de una manera que se entiende matemáticamente mediante visualizaciones interactivas, así como información clínica y de base de datos para el descubrimiento biológico. CorEx realiza la maximización de la información de una manera que requiere relativamente pocos ejemplos para encontrar clústeres en datos de alta dimensión. La jerarquía de factores latentes que produce facilita la comprensión biológica.
Este método ya ha demostrado ser interesante cuando se aplica a la biología del cáncer. Sus fundamentos teóricos de la información lo hacen aplicable a cualquier sistema con muchas variables y poco conocimiento previo sobre sus relaciones. Comience navegando a la página principal de CorExplorer.
En Vínculos rápidos, haga clic en el botón más expandir para ver un resumen del gráfico de factor CorEx que se entrenó sobre los datos de cáncer de interés. Por ejemplo, aquí se muestran los gráficos de factores para los datos de cáncer de ovario TCGA. Después de inspeccionar los gráficos de factores, haga clic en TCGA-LUAD pulmonar para acceder a la página CorExplorer para la secuenciación de ARN de cáncer de pulmón y utilice la ventana CorExplorer Factor Graph para explorar el gráfico de factor CorEx en busca de un gen de interés.
Al mover el cursor del ratón sobre la ventana de visualización del gráfico de factores, haga zoom en el gráfico de factores utilizando el trackpad del ratón para ver los detalles del gráfico, como los genes más importantes en cada factor y las conexiones entre los nodos en diferentes capas. Para localizar un gen objetivo, haga clic en el menú Gene y escriba el nombre del gen para seleccionarlo en la lista desplegable. Pulse Retorno en el teclado para hacer que la vista se acerque al factor con el que el gen de interés está más fuertemente correlacionado.
Vuelva a colocar el ratón sobre la visualización del gráfico y desplácese para alejar para ver el nivel del nodo y sus factores asociados que son vecinos del factor genético más cercano. Tenga en cuenta que solo se muestran los genes con un peso superior al umbral indicado en el control deslizante Grosor de vínculo mínimo. Para ver todos los genes asociados con el factor, haga clic en el nodo adecuado y seleccione Cargar genes adicionales en la ventana emergente.
Cuando aparezca Listo, cierre la ventana emergente. En la sección de encabezado, haga clic y arrastre el modificador de peso de vínculo mínimo a 0,05 para permitir que los genes aparezcan en orden de peso. Para identificar asociaciones con una función biológica, en la ventana Anotación desactive la clasificación de la tasa de detección falsa para ordenar el menú desplegable Factor por número de factor en lugar de tasa de detección falsa.
Desplácese y haga clic para seleccionar el factor de interés en el menú desplegable de la ventana Anotación para mostrar las anotaciones de enriquecimiento del factor. A continuación, haga clic en un factor de enriquecimiento para ver inmediatamente los genes asociados como resaltados en amarillo en la visualización del gráfico. Tenga en cuenta que los factores que desaparecen o aparecen como términos GO diferentes se seleccionan en función de si están enriquecidos o no para los genes con la anotación seleccionada.
Para los factores de interés de filtro, utilizando la supervivencia y la calidad del clúster, en el menú desplegable Conjunto de datos, seleccione TCGA_OVCA ir a la página CorExplorer para la secuenciación de ARN de cáncer de ovario TCGA. Anote en la ventana Supervivencia el factor con el mayor diferencial de supervivencia y seleccione este factor en la ventana Gráfico de factores en el menú desplegable Factor. Haga clic y arrastre el control deslizante Grosor del vínculo a 0,5 y anote el número de genes en el factor.
Expanda la lista de factores en la ventana Supervivencia y haga clic en el siguiente mejor factor en el menú desplegable Ventana Supervivencia para ver sus curvas de supervivencia asociadas. Se mostrarán las anotaciones significativas GO y Kegg. Para comprender mejor el papel biológico de los genes en este factor, seleccione la capa Factor en la parte superior de la ventana Gráfico de factores y mueva el ratón sobre la ventana mientras se aleja para revelar todo el clúster y los factores asociados.
Para comprender la importancia relativa de los factores vinculados al nodo del clúster, desactive Ordenar por p-val en la ventana Supervivencia y haga clic en cada uno de los números de factor en sucesión para verlos, teniendo en cuenta los factores que muestran una asociación de supervivencia. En el menú Agregar ventana, seleccione PPI y haga clic en Agregar para agregar una ventana de gráfico PPI al área de visualización. En la ventana de gráficos PPI, seleccione una capa de factor de interés para mostrar las interacciones proteína-proteína que son significativas.
Haga clic en el vínculo Ver en StringDB para conectarse a la base de datos en línea STRINGdb y haga clic en Continuar. A continuación, abra la pestaña Anaylsis para obtener un análisis GO en línea para los genes de la red PPI. Se mostrará el componente celular superior.
Vuelva a la pestaña CorExplorer y a la ventana PPI y seleccione otro factor. Vuelva a hacer clic en el vínculo Ver en StringDB. Se mostrará un componente celular superior diferente.
A continuación, en la ventana PPI, seleccione otro factor para un análisis de base de datos STRING. Para encontrar puntos en común y diferencias de variación de la expresión génica entre los tipos de tumor, haga clic en el encabezado CorExplorer para volver a la página principal y haga clic en Buscar para acceder a una página que permita buscar todos los conjuntos de datos en el sitio CorExplorer. En el cuadro Búsqueda genética, escriba un nombre de gen de interés y haga clic en Buscar.
Por ejemplo, como se ha demostrado FLT1 se encuentra con un peso relativamente alto y varios factores diferentes. La búsqueda del gen BRCA1 en el conjunto de datos sobre el cáncer de pulmón revela que el gen es el más fuertemente asociado con corEx factor 26. El enriquecimiento del término GO para este factor es extremadamente alto, con la reparación del ADN exhibiendo una tasa de descubrimiento falso de sólo una vez 10 a la negativa 19.
La selección también llama la atención sobre el grupo de segundo nivel L2_8 que tiene seis factores estrechamente relacionados como niños. La red de interacción proteína-proteína de reparación del ADN está fuertemente conectada, apoyando aún más la funcionalidad estrechamente vinculada de los genes en el factor 26. Los gráficos de supervivencia asociados sugieren una posible asociación con la supervivencia del paciente que tendría que confirmarse en un conjunto de datos más grande.
Comenzar con la evaluación de la supervivencia puede permitir la disección de los factores que se correlacionan con una supervivencia mejorada como asociado con grupos de expresión génica particulares. La adición de una ventana de interacción proteína-proteína para cada factor a su vez facilita la determinación de posibles explicaciones para sus asociaciones con la supervivencia. Es importante comprobar los mapas de calor de cada factor para confirmar que el patrón de expresión génica es de una calidad adecuada para apoyar las interpretaciones biológicas.
Los mapas de calor que muestran variaciones fuertes y claras en los patrones de expresión génica pueden exhibir una expresión coordinada de los genes del factor, que van de patrones altos a bajos, o más complejos, con algunos genes con baja expresión correlacionada con otros genes con una alta expresión. El objetivo general de este procedimiento es establecer una terapia personalizada mediante el mapeo de un tumor de muestra en los factores CorExplorer para identificar posibles terapias específicas del tumor.