JoVE Logo

Iniciar sesión

Se requiere una suscripción a JoVE para ver este contenido. Inicie sesión o comience su prueba gratuita.

En este artículo

  • Resumen
  • Resumen
  • Introducción
  • Protocolo
  • Resultados
  • Discusión
  • Divulgaciones
  • Agradecimientos
  • Materiales
  • Referencias
  • Reimpresiones y Permisos

Resumen

Aquí, proporcionamos una metodología que utiliza diferentes representaciones moleculares para mostrar y analizar el espacio químico de los conjuntos de datos de compuestos naturales, con un enfoque en aplicaciones relacionadas con el descubrimiento de fármacos.

Resumen

El espacio químico es un espacio descriptor multidimensional que encierra todas las moléculas posibles, y se cree que al menos 1 x 1060 sustancias orgánicas con un peso molecular inferior a 500 Da son potencialmente relevantes para el descubrimiento de fármacos. Los productos naturales han sido la fuente principal de las nuevas entidades farmacológicas comercializadas durante los últimos cuarenta años y siguen siendo una de las fuentes más productivas para la creación de medicamentos innovadores. Las herramientas computacionales basadas en quimioinformática aceleran el proceso de desarrollo de fármacos para productos naturales. Se han utilizado métodos que incluyen la estimación de bioactividades, perfiles de seguridad, ADME y medición de semejanza de productos naturales. Aquí, repasamos los desarrollos recientes en herramientas quimioinformáticas diseñadas para visualizar, caracterizar y expandir el espacio químico de conjuntos de datos de compuestos naturales utilizando varias representaciones moleculares, crear representaciones visuales de dichos espacios e investigar las relaciones estructura-propiedad dentro de los espacios químicos. Con énfasis en las aplicaciones de descubrimiento de fármacos, evaluamos las bases de datos de código abierto BIOFACQUIM y PeruNPDB como prueba de concepto.

Introducción

Los productos naturales (NP), que son compuestos químicos creados por los seres vivos, se han utilizado como tratamientos tradicionales durante siglos. Las NP individuales se han creado como medicamentos en la era moderna y se han explotado con éxito como compuestos principales en el descubrimiento de fármacos. Las sustancias marinas, fúngicas, bacterianas, vegetales y endógenas creadas por humanos y animales se incluyen en la categoría de compuestos bioactivos, al igual que los venenos y venenos producidos por diversos animales2. Como resultado, durante cuarenta años, el número de medicamentos elaborados por las NP representó una fuente significativa de nuevas sustancias farmacológicas3, enfatizando que las NP han sido cruciales en el desarrollo de nuevos medicamentos, particularmente para el tratamiento del cáncer y las enfermedades infecciosas, así como para otras condiciones terapéuticas como la esclerosis múltiple y las enfermedades cardiovasculares4. Además, el 64,9% de los 185 pequeños compuestos que fueron autorizados para tratar el cáncer entre 1981 y 2019 eran NPs no modificados o medicamentos sintéticos con un farmacoforo NP3.

La quimioinformática, una interdisciplinaria bien establecida que se basa en el concepto de espacio químico, se ha utilizado para analizar y visualizar el espacio químico de las cualidades fisicoquímicas de las NP vinculadas a rasgos similares a los de los medicamentos5. La quimioinformática ha demostrado un impacto sustancial en el diseño y descubrimiento de fármacos basados en NPs6. El espacio químico de un grupo de compuestos no siempre es único. Dependerá de la colección de descriptores utilizados para definirlo, lo que significa que el estudio del espacio químico de las NPs como de cualquier otro conjunto de compuestos, presenta desafíos particulares que descansan en la representación molecular7. Este esfuerzo se puede abordar utilizando una variedad de descriptores moleculares y técnicas de visualización de datos. Por el contrario, las técnicas más utilizadas son el análisis de componentes principales (PCA), los árboles de andamios, los mapas autoorganizados, el mapeo topográfico generativo (GTM) y una nueva técnica de visualización llamada mapas de árboles (TMAP)8. Además, la recopilación, evaluación y difusión de información química de NP en bases de datos de compuestos es uno de los usos de la quimioinformática en la investigación de NP. Por el contrario, con la introducción del big data, esto es especialmente pertinente9.

Aquí, se utilizan las bases de datos NP de código abierto BIOFACQUIM10 y PeruNPDB11 para describir el protocolo que busca la visualización y caracterización del espacio químico de conjuntos de datos de compuestos naturales utilizando varias representaciones moleculares, crea representaciones visuales de dichos espacios e investiga las relaciones estructura-propiedad dentro de los espacios químicos, con énfasis en las aplicaciones de descubrimiento de fármacos.

Access restricted. Please log in or start a trial to view this content.

Protocolo

1. Descarga e instalación del software

  1. Actualiza el directorio de este proyecto. Para un acceso conveniente, coloque los ejecutables y archivos en este directorio.
  2. Instale los paquetes de software necesarios después de descargarlos.
  3. Descargue la última versión del software The Osiris DataWarrior (OSIRIS), que se puede encontrar en https://openmolecules.org/datawarrior/
  4. Descargue la última versión de la plataforma de análisis The Konstanz Information Miner (KNIME), que se puede encontrar en https://www.knime.com/
  5. Descargue la última versión del software The GraphPad Prism, que se puede encontrar en https://www.graphpad.com/
    NOTA: El software Osiris DataWarrior y la plataforma de análisis Konstanz Information Miner (KNIME) se pueden usar en una computadora personal y son gratuitos para uso individual, mientras que el software GraphPad Prism se puede comprar en (https://www.graphpad.com/).

2. Construcción y conservación de una base de datos de compuestos

NOTA: Busque sustancias y fuentes que tengan los datos necesarios. Se recomienda al usuario que tenga los siguientes detalles para cada compuesto en una hoja de cálculo.

  1. Nombra cada compuesto. Agregue los nombres de todos los compuestos que se describen en la fuente en la primera columna de una hoja de cálculo.
  2. Asigne un código interno estandarizado si se crea una colección interna, o asigne un número que identifique de manera única este compuesto en la base de datos consultada.
  3. Proporcione la entrada de estructura utilizando la notación canónica SMILES, que se puede importar a otras herramientas de edición molecular.
    1. Lo ideal es guardar la base de datos en .csv formato una vez que estos datos se hayan recopilado en la hoja de cálculo.
    2. Emplee el software OSIRIS para generar los archivos de datos de estructura (SDF), el archivo de datos moleculares (mol) y el mol2 del conjunto de datos, que también contienen información química y son interoperables con la mayoría de los paquetes de software. Para ello, cargue el archivo .csv haciendo clic en el botón Archivo y, a continuación, en el botón Abrir .
    3. Cargue el conjunto de datos en la plataforma de análisis KNIME para mejorar la calidad de los datos y evitar resultados inexactos. Para ello, cargue el archivo .sdf o .mol2 haciendo clic en el botón Archivo y, a continuación, en el botón Abrir .
  4. Asegurar la uniformidad en las estructuras químicas.
    1. Examine cada estructura química en busca de tipos de átomos válidos y comprobaciones de valencia. Estandarice las estructuras convirtiéndolas en una forma tautomérica canónica, kekulizando estructuras aromáticas, estandarizando el posicionamiento de los enlaces estéreo y convirtiendo todos los hidrógenos implícitos en hidrógenos explícitos utilizando el flujo de trabajo de estandarización de estructuras moleculares de KNIME.
    2. Encuentre y elimine duplicados después de que las moléculas se hayan estandarizado correctamente empleando el flujo de trabajo de estandarización de estructuras moleculares de KNIME. Utilice las teclas InChI como notación lineal para localizar varios estados de protonación y tautómeros.
    3. Eliminar duplicados.
    4. Enumerar tautómeros y estereoisómeros. Este paso es crucial en los estudios de cribado virtuales, especialmente cuando se utilizan métodos de búsqueda como el acoplamiento o el filtrado basado en farmacoforos.

3. Descriptores moleculares y análisis de diversidad

NOTA: Los descriptores moleculares, como las cualidades fisicoquímicas, las huellas moleculares y los andamios químicos, son los enfoques más comunes para representar moléculas en aplicaciones quimioinformáticas. El análisis se puede realizar aquí: http://132.248.103.152:3838/PUMA/. Todos los pasos que se describen a continuación se detallan en el sitio web de PUMA.

  1. Calcular las seis cualidades fisicoquímicas más prevalentes de relevancia farmacológica: peso molecular (MW), coeficiente de partición octanol/agua (clogP), área de superficie topológica (TPSA), solubilidad acuosa (clogS), número de átomos donantes de enlace H (HBD) y número de átomos aceptores de enlace H (HBA). Consulta el sitio web de PUMA para obtener más información.
  2. Calcule las claves MACCS de 166 bits, la similitud por pares de Tanimoto y las huellas dactilares de conectividad extendida de diámetro 4 (ECFP4), junto con otras huellas dactilares circulares adecuadas para el cribado virtual, el modelado del paisaje de actividades y la investigación de relaciones estructura-actividad (SAR).
  3. Calcule un estadístico de tendencia central para cada comparación por pares. Garantice la diversidad en el conjunto de datos con una media o mediana más pequeña, contrariamente a la distancia euclidiana o a cualquier métrica de distancia general.
  4. Compruebe si los valores calculados se han registrado en la bibliografía o se han calculado para otras bases de datos de referencia con fines de comparación. Para ello, consulte sitios web como PubChem o CHEMBL.
  5. Genere gráficos de violín para su visualización dentro del software GraphPad Prism, mostrando los valores máximos y mínimos.

4. Visualización del espacio químico

NOTA: Es posible condensar la mayoría de los datos pertinentes en un pequeño número de variables utilizando PCA y otras técnicas de reducción de dimensionalidad. Por lo tanto, las visualizaciones del espacio químico son posibles.

  1. Seleccione los seis descriptores para determinar la similitud o la distancia. Cree la matriz de similitud (o distancia) en consecuencia.
  2. Realizar análisis de PCA en la matriz. Seleccione dos o tres componentes principales para el trazado. Considere la proporción de varianza capturada por cada componente primario.
  3. Genere representaciones de diagramas de dispersión bidimensionales o tridimensionales para PCA utilizando el nodo Plotly KNIME.

5. Diagramas de diversidad de consenso

NOTA: Se han desarrollado representaciones visuales para resumir algunas características que se pueden utilizar para cuantificar la variedad. El análisis de los gráficos de diversidad de consenso (CDPs)12 se puede realizar aquí http://132.248.103.152:3838/CDPlots/.

  1. Cree una gráfica con el número de compuestos de la base de datos para determinar el tamaño del punto de datos. Utilice la diversidad de huellas moleculares para el eje x, la diversidad de andamios para el eje y, la diversidad basada en propiedades fisicoquímicas para la escala continua de color y el número relativo de compuestos en el conjunto de datos para el tamaño del punto de datos.
  2. Genere el gráfico de múltiples variables utilizando el software GraphPad Prism.

Access restricted. Please log in or start a trial to view this content.

Resultados

Propiedades moleculares y visualización del espacio químico
Todos los compuestos en los conjuntos de datos BIOFACQUIM10, PeruNPDB11 y FDA13 tenían seis propiedades fisicoquímicas calculadas para ellos. Estas cualidades se trazaron en diagramas de violín, lo que permite ver cómo se distribuyen las propiedades de los tres conjuntos de datos estudiados (Figura 1). ...

Access restricted. Please log in or start a trial to view this content.

Discusión

Debido a sus muchos usos potenciales, como la clasificación de compuestos, la selección de compuestos, la exploración de los vínculos estructura-actividad y la navegación a través de las interacciones estructura-propiedad, el concepto de espacio químico se emplea hoy en día ampliamente en el proceso de descubrimiento y desarrollo defármacos 14. Además, la creación de bases de datos de NP es un procedimiento fundamental para realizar diversos estudios co...

Access restricted. Please log in or start a trial to view this content.

Divulgaciones

Los autores declaran que no tienen ningún conflicto de intereses.

Agradecimientos

HLBC y MACH agradecen el financiamiento de la Universidad Católica de Santa María (subvenciones 27499-R-2020, 27574-R-2020, 7309-CU-2020 y 28048-R-2021). JLMF agradece el financiamiento de la DGAPA, UNAM, Programa de Apoyo a Proyectos de Investigación e Innovación Tecnológica (PAPIIT), subvención No. IN201321.

Access restricted. Please log in or start a trial to view this content.

Materiales

NameCompanyCatalog NumberComments
GraphPad PrismGraphPad Prismhttps://www.graphpad.com/
KNIME platformKNIMEhttps://www.knime.com
Osiris DataWarrior (OSIRIS) softwareopenmolecules.orghttps://openmolecules.org/datawarrior/
PUMAPUMA: Platform for Unified Molecular Analysishttp://132.248.103.152:3838/PUMA/

Referencias

  1. Boufridi, A., Quinn, R. J. Harnessing the properties of natural products. Annu Rev Pharmacol Toxicol. 58, 451-470 (2018).
  2. Gómez-García, A., et al. Navigating the chemical space and chemical multiverse of a unified Latin American natural product database: LANaPDB. ChemRxiv. , (2023).
  3. Newman, D. J., Cragg, G. M. Natural products as sources of new drugs over the nearly four decades from 01/1981 to 09/2019. J Nat Prod. 83 (3), 770-803 (2020).
  4. Atanasov, A. G., Zotchev, S. B., Dirsch, V. M., Supuran, C. T. Natural products in drug discovery: advances and opportunities. Nat Rev Drug Discov. 20 (3), 200-216 (2021).
  5. Medina-Franco, J. L., Saldívar-González, F. I. Cheminformatics to characterize pharmacologically active natural products. Biomolecules. 10 (11), 1566(2020).
  6. Chen, Y., Garcia De Lomana, M., Friedrich, N. O., Kirchmair, J. Characterization of the Chemical Space of Known and Readily Obtainable Natural Products. J Chem Inf Model. 58 (8), 1518-1532 (2018).
  7. Gaytán-Hernández, D., Chávez-Hernández, A. L., López-López, E., Miranda-Salas, J., Saldívar-González, F. I., Medina-Franco, J. L. Art driven by visual representations of chemical space. ChemRxiv. , (2023).
  8. Zabolotna, Y., Ertl, P., Horvath, D., Bonachera, F., Marcou, G., Varnek, A. NP Navigator: A new look at the natural product chemical space. Mol Inform. 40 (9), e2100068(2021).
  9. Martinez-Mayorga, K., Madariaga-Mazon, A., Medina-Franco, J. L., Maggiora, G. The impact of chemoinformatics on drug discovery in the pharmaceutical industry. Expert Opin Drug Discov. 15 (3), 293-306 (2020).
  10. Pilón-Jiménez, B., Saldívar-González, F., Díaz-Eufracio, B., Medina-Franco, J. BIOFACQUIM: A Mexican compound database of natural products. Biomolecules. 9 (1), 31(2019).
  11. Barazorda-Ccahuana, H. L., et al. PeruNPDB: the Peruvian natural products database for in silico drug screening. Sci Rep. 13 (1), 7577(2023).
  12. González-Medina, M., Prieto-Martínez, F. D., Owen, J. R., Medina-Franco, J. L. Consensus diversity plots: a global diversity analysis of chemical libraries. J Cheminform. 8, 63(2016).
  13. Irwin, J. J., et al. ZINC20-A free ultralarge-scale chemical database for ligand discovery. J Chem Inf Model. 60 (12), 6065-6073 (2020).
  14. Naveja, J. J., Medina-Franco, J. L. Finding constellations in chemical space through core analysis. Front Chem. 7, 510(2019).
  15. Cavasotto, C. N., Di Filippo, J. I. Artificial intelligence in the early stages of drug discovery. Arch Biochem Biophys. 698, 108730(2021).
  16. Rosén, J., Gottfries, J., Muresan, S., Backlund, A., Oprea, T. I. Novel chemical space exploration via natural products. J Med Chem. 52 (7), 1953-1962 (2009).
  17. Sliwoski, G., Kothiwale, S., Meiler, J., Lowe Jr, E. W. Computational methods in drug discovery. Pharmacol Rev. 66 (1), 334-395 (2014).
  18. Goyzueta-Mamani, L. D., Barazorda-Ccahuana, H. L., Mena-Ulecia, K., Chávez-Fumagalli, M. A. Antiviral activity of metabolites from Peruvian plants against SARS-CoV-2: An in silico approach. Molecules. 26 (13), 3882(2021).
  19. Goyzueta-Mamani, L. D., et al. In silico analysis of metabolites from Peruvian native plants as potential therapeutics against Alzheimer's disease. Molecules. 27 (3), 918(2022).
  20. Barazorda-Ccahuana, H. L., et al. Computer-aided drug design approaches applied to screen natural product's structural analogs targeting arginase in Leishmania spp. F1000Research. 12, 93(2023).
  21. McGrady, M. Y., Colby, S. M., Nuñez, J. R., Renslow, R. S., Metz, T. O. AI for chemical space gap filling and novel compound generation. arXiv. , (2022).
  22. Medina-Franco, J., Martinez-Mayorga, K., Giulianotti, M., Houghten, R., Pinilla, C. Visualization of the chemical space in drug discovery. Curr Comput Aided-Drug Des. 4 (4), 322-333 (2008).
  23. Osolodkin, D. I., Radchenko, E. V., Orlov, A. A., Voronkov, A. E., Palyulin, V. A., Zefirov, N. S. Progress in visual representations of chemical space. Expert Opin Drug Discov. 10 (9), 959-973 (2015).
  24. Sheridan, R. P., Kearsley, S. K. Why do we need so many chemical similarity search methods. Drug Discov Today. 7 (17), 903-911 (2002).
  25. Singh, N., Guha, R., Giulianotti, M. A., Pinilla, C., Houghten, R. A., Medina-Franco, J. L. Chemoinformatic analysis of combinatorial libraries, drugs, natural products, and molecular libraries Small Molecule Repository. J Chem Inf Model. 49 (4), 1010-1024 (2009).
  26. Medina-Franco, J. L., Chávez-Hernández, A. L., López-López, E., Saldívar-González, F. I. Chemical multiverse: An expanded view of chemical space. Mol Inform. 41 (11), e2200116(2022).

Access restricted. Please log in or start a trial to view this content.

Reimpresiones y Permisos

Solicitar permiso para reutilizar el texto o las figuras de este JoVE artículos

Solicitar permiso

Explorar más artículos

Espacio Qu micoBases de Datos de Productos NaturalesDescubrimiento de F rmacosEntidades Farmacol gicasQuimioinform ticaBioactividadesPerfiles de SeguridadADMESemejanza de Productos NaturalesRepresentaciones MolecularesRelaciones Estructura PropiedadBIOFACQUIMPer NPDB

This article has been published

Video Coming Soon

JoVE Logo

Privacidad

Condiciones de uso

Políticas

Investigación

Educación

ACERCA DE JoVE

Copyright © 2025 MyJoVE Corporation. Todos los derechos reservados