Se requiere una suscripción a JoVE para ver este contenido. Inicie sesión o comience su prueba gratuita.
Method Article
Presentamos CorrelationCalculator y Filigree, dos herramientas para la construcción de redes basadas en datos y el análisis de datos metabolómicos. CorrelationCalculator admite la construcción de una única red de interacción de metabolitos basada en datos de expresión, mientras que Filigrana permite construir una red diferencial, seguida de la agrupación de redes y el análisis de enriquecimiento.
Un reto importante en el análisis de los datos ómicos es la extracción de conocimientos biológicos procesables. La metabolómica no es una excepción. El problema general de relacionar los cambios en los niveles de metabolitos individuales con procesos biológicos específicos se ve agravado por el gran número de metabolitos desconocidos presentes en los estudios de cromatografía líquida y espectrometría de masas (LC-MS) no dirigidos. Además, el metabolismo secundario y el metabolismo lipídico están escasamente representados en las bases de datos de vías existentes. Para superar estas limitaciones, nuestro grupo ha desarrollado varias herramientas para la construcción y el análisis de redes basadas en datos. Estos incluyen CorrelationCalculator y Filigrana. Ambas herramientas permiten a los usuarios construir redes basadas en correlaciones parciales a partir de datos metabolómicos experimentales cuando el número de metabolitos supera el número de muestras. CorrelationCalculator admite la construcción de una sola red, mientras que Filigrana permite crear una red diferencial utilizando datos de dos grupos de muestras, seguidos de agrupación en clústeres de red y análisis de enriquecimiento. Describiremos la utilidad y aplicación de ambas herramientas para el análisis de datos metabolómicos de la vida real.
En la última década, la metabolómica se ha convertido en una ciencia ómica debido a los avances en tecnologías analíticas como la cromatografía de gases-espectrometría de masas (GC-MS) y la cromatografía líquida-espectrometría de masas (LC-MS). Estas técnicas permiten la medición simultánea de cientos a miles de metabolitos de moléculas pequeñas, creando conjuntos de datos multidimensionales complejos. Los experimentos metabolómicos se pueden realizar en modo dirigido o no dirigido. Los experimentos de metabolómica dirigida miden clases específicas de metabolitos. Por lo general, se basan en hipótesis, mientras que los enfoques no dirigidos intentan medir tantos metabolitos como sea posible y son de naturaleza generadora de hipótesis. Los ensayos dirigidos suelen incluir patrones internos y, por lo tanto, permiten la cuantificación absoluta de los metabolitos de interés. Por el contrario, los ensayos no dirigidos permiten la cuantificación relativa e incluyen muchos metabolitos desconocidos1.
El análisis de datos metabolómicos es un proceso de varios pasos que aprovechamuchas herramientas de software especializadas. Se puede dividir en los siguientes tres pasos principales: (1) procesamiento de datos y control de calidad, (2) análisis estadístico y (3) interpretación de datos biológicos. Las herramientas descritas aquí están diseñadas para permitir el último paso del análisis.
Una forma intuitiva y popular de interpretar los datos metabolómicos es mapear las mediciones experimentales en las vías metabólicas. Para lograrlo se han diseñado numerosas herramientas 2,3,4,5, entre ellas Metscape, desarrollada por nuestro grupo6. El mapeo de vías a menudo se combina con el análisis de enriquecimiento, lo que ayuda a identificar las vías más significativas 7,8. Estas técnicas ganaron protagonismo por primera vez en el análisis de datos de expresión génica y se han aplicado con éxito para el análisis de datos de proteómica y epigenómica 9,10,11,12,13. Sin embargo, el análisis de los datos metabolómicos presenta una serie de desafíos para los enfoques basados en el conocimiento. En primer lugar, además de los metabolitos endógenos, los ensayos metabolómicos miden compuestos exógenos, incluidos los que provienen de la nutrición y otras fuentes ambientales. Estos compuestos, así como los metabolitos producidos por las bacterias, no pueden ser mapeados en las vías humanas o metabólicas de otros organismos eucariotas. Además, la cobertura de la vía del metabolismo secundario y del metabolismo lipídico actualmente no permite un mapeo de alta resolución al nivel que apoyaría fácilmente la interpretación biológica de los datos14,15.
Las técnicas de análisis de redes basadas en datos pueden ayudar a superar estos desafíos. Por ejemplo, las redes basadas en la correlación pueden ayudar a derivar relaciones entre metabolitos conocidos y desconocidos y facilitar la anotación de las incógnitas16. Si bien el cálculo de los coeficientes de correlación de Pearson es el enfoque más sencillo para establecer las relaciones lineales entre los metabolitos, la desventaja es que captura asociaciones directas e indirectas17,18,19. Una alternativa es calcular coeficientes de correlación parciales que puedan distinguir entre asociaciones directas e indirectas. El modelado gráfico gaussiano (GGM) se puede utilizar para estimar redes de correlación parcial. Sin embargo, GGM requiere que el tamaño de la muestra y el número de características sean comparables. Esta condición rara vez se cumple en los datos de LC-MS no dirigidos que contienen mediciones de miles de características metabólicas. Se pueden utilizar técnicas de regularización para superar esta limitación. El lazo gráfico (Glasso) y la regresión de nodos son métodos populares para la estimación regularizada de la red de correlación parcial 16,20.
La primera de las herramientas bioinformáticas aquí presentadas, CorrelationCalculator16, se basa en el algoritmo de correlación parcial dispersa desviada (DSPC). DSPC se basa en el modelado de lazo gráfico no dispersificado. La suposición subyacente del algoritmo es que el número de conexiones entre los metabolitos es considerablemente menor que el número de muestras, es decir, la red de correlación parcial de metabolitos es escasa. Esta suposición permite a DSPC descubrir la conectividad entre un gran número de metabolitos utilizando menos muestras, aprovechando las técnicas de regresión regularizada. Además, utilizando un paso de dessesgo para las estimaciones de regresión regularizada, obtiene distribuciones de muestreo para los parámetros de borde que se pueden utilizar para construir intervalos de confianza y probar hipótesis de interés (por ejemplo, presencia/ausencia de un solo borde o de un grupo de bordes). Por lo tanto, la presencia o ausencia de un borde en la red de correlación parcial se puede probar formalmente utilizando los valores p calculados.
CorrelacioneCalculator demostró ser muy útil para el análisis de un solo grupo16; Sin embargo, el objetivo de muchos experimentos metabolómicos es el análisis diferencial de dos o más condiciones. Aunque CorrelationCalculator se puede emplear en cada uno de los grupos por separado para generar redes de correlación parciales para cada condición, este enfoque limita el número de muestras que se pueden utilizar para la generación de redes. Dado que un tamaño de muestra suficientemente grande es una de las consideraciones más importantes en el análisis basado en datos, los métodos que pueden aprovechar todas las muestras disponibles en los datos para construir redes son muy deseables. Este enfoque se implementa en la segunda herramienta que se presenta aquí, llamada Filigrana21. Filigrana se basa en el algoritmo de Análisis de Enriquecimiento Diferencial de Red (ADN) publicado anteriormente22. En la Tabla 1 se muestran las aplicaciones y el flujo de trabajo de ambas herramientas.
Número de condiciones experimentales (k) | k = 1 | k = 2 |
Herramienta de software | Calculadora de correlación | Filigrana |
Datos de entrada | • Matriz de datos de metabolitos x muestras | • Matriz de datos de metabolitos x muestras • Grupos experimentales |
Flujo de trabajo •Pretratamiento • Estimación de la red • Agrupación en clústeres de red • Análisis de enriquecimiento | • Transformación logarítmica; Escalado automático • DSPC • A través de aplicaciones externas •No | • Transformación logarítmica; Escalado automático • Estimación de la red conjunta • Agrupación por consenso • NetGSA |
Visualización de datos | A través de una aplicación externa, por ejemplo, Cytoscape | A través de una aplicación externa, por ejemplo, Cytoscape |
Prueba de módulos metabólicos para la asociación con el resultado de interés (opcional) | A través de aplicaciones externas | A través de aplicaciones externas |
Tabla 1: El ámbito de aplicación y el flujo de trabajo de CorrelationCalculator y Filigrana.
Access restricted. Please log in or start a trial to view this content.
1. Calculadora de correlación
2. Filigrana
3. Consideraciones adicionales
Access restricted. Please log in or start a trial to view this content.
Para ilustrar el uso de CorrelationCalculator, construimos una red de correlación parcial utilizando un subconjunto de los datos metabolómicos del estudio poblacional KORA descrito en Krumsiek et al.24. El conjunto de datos contenía 151 metabolitos y 240 muestras. La Figura 1 muestra la red de correlación parcial resultante que se visualizó en Cytoscape. La red contiene 148 nodos y 272 bordes. El color de los nodos representa los metabolitos que pertenec...
Access restricted. Please log in or start a trial to view this content.
Los métodos de análisis de redes basados en correlaciones parciales implementados en CorrelationCalculator y Filigree ayudan a superar algunas de las limitaciones de los análisis de vías metabólicas basados en el conocimiento, especialmente para los conjuntos de datos con una alta prevalencia de metabolitos desconocidos y una cobertura limitada de vías metabólicas (por ejemplo, datos lipidómicos). Estas herramientas han sido ampliamente utilizadas por la comunidad investigadora para analizar una amplia gama de da...
Access restricted. Please log in or start a trial to view this content.
Los autores no tienen intereses financieros contrapuestos.
Este trabajo fue financiado por la subvención NIH 1U01CA235487.
Access restricted. Please log in or start a trial to view this content.
Name | Company | Catalog Number | Comments |
CorrelationCalculator | JAVA | http://metscape.med.umich.edu/calculator.html | |
clusterNet | https://github.com/Karnovsky-Lab/clusterNet | ||
Cytoscape | Cytoscape | https://cytoscape.org/ | |
Filigree | JAVA | http://metscape.med.umich.edu/filigree.html | |
MetScape | Cytoscape | https://apps.cytoscape.org/apps/metscape | Cytoscape application that allows for the creation and exploration of correlation networks. |
Access restricted. Please log in or start a trial to view this content.
Solicitar permiso para reutilizar el texto o las figuras de este JoVE artículos
Solicitar permisoThis article has been published
Video Coming Soon
ACERCA DE JoVE
Copyright © 2025 MyJoVE Corporation. Todos los derechos reservados