JoVE Logo

S'identifier

Un abonnement à JoVE est nécessaire pour voir ce contenu. Connectez-vous ou commencez votre essai gratuit.

Dans cet article

  • Résumé
  • Résumé
  • Introduction
  • Protocole
  • Résultats
  • Discussion
  • Déclarations de divulgation
  • Remerciements
  • matériels
  • Références
  • Réimpressions et Autorisations

Résumé

Ici, nous proposons une méthodologie qui utilise différentes représentations moléculaires pour afficher et analyser l’espace chimique des ensembles de données de composés naturels, en mettant l’accent sur les applications liées à la découverte de médicaments.

Résumé

L’espace chimique est un espace descripteur multidimensionnel qui englobe toutes les molécules possibles, et au moins 1 x 1060 substances organiques d’un poids moléculaire inférieur à 500 Da sont considérées comme potentiellement pertinentes pour la découverte de médicaments. Les produits naturels ont été la principale source des nouvelles entités pharmacologiques commercialisées au cours des quarante dernières années et continuent d’être l’une des sources les plus productives pour la création de médicaments innovants. Les outils informatiques basés sur la chimiothérapie accélèrent le processus de développement de médicaments pour les produits naturels. Des méthodes telles que l’estimation des bioactivités, les profils d’innocuité, l’ADME et la mesure de la ressemblance naturelle des produits ont été utilisées. Ici, nous passons en revue les développements récents d’outils chimioinformatiques conçus pour visualiser, caractériser et élargir l’espace chimique des ensembles de données de composés naturels à l’aide de diverses représentations moléculaires, créer des représentations visuelles de ces espaces et étudier les relations structure-propriété au sein des espaces chimiques. En mettant l’accent sur les applications de découverte de médicaments, nous évaluons les bases de données open source BIOFACQUIM et PeruNPDB comme preuve de concept.

Introduction

Les produits naturels (NP), qui sont des composés chimiques créés par des êtres vivants, sont utilisés comme traitements traditionnels depuis des siècles. Les NP individuelles ont été créées comme médicaments à l’ère moderne et exploitées avec succès comme composés phares dans la découverte de médicaments1. Les substances marines, fongiques, bactériennes, végétales et endogènes créées par les humains et les animaux sont incluses dans la catégorie des composés bioactifs, tout comme les venins et les poisons produits par divers animaux2. En conséquence, pendant quarante ans, le nombre de médicaments fabriqués par les IP a représenté une source importante de nouvelles substances pharmacologiques3, soulignant que les IP ont joué un rôle crucial dans le développement de nouveaux médicaments, en particulier pour le traitement du cancer et des maladies infectieuses, ainsi que pour d’autres conditions thérapeutiques comme la sclérose en plaques et les maladies cardiovasculaires4. De plus, 64,9 % des 185 petits composés autorisés pour traiter le cancer entre 1981 et 2019 étaient des NP non modifiés ou des médicaments synthétiques avec un pharmacophore NP3.

La chimioinformatique, une interdiscipline bien établie qui repose sur le concept d’espace chimique, a été utilisée pour analyser et visualiser l’espace chimique des qualités physicochimiques des NP liées à des traits pseudo-médicamenteux5. La chimio-informatique a montré un impact substantiel sur la conception et la découverte de médicaments basés sur les NPs6. L’espace chimique d’un groupe de composés n’est pas toujours unique. Cela dépendra de l’ensemble des descripteurs utilisés pour le définir, ce qui signifie que l’étude de l’espace chimique des NP comme de tout autre ensemble de composés, présente des défis particuliers qui reposent sur la représentation moléculaire7. Cette entreprise peut être abordée à l’aide d’une variété de descripteurs moléculaires et de techniques de visualisation de données. En revanche, les techniques les plus souvent utilisées sont l’analyse en composantes principales (ACP), les arbres d’échafaudage, les cartes auto-organisées, la cartographie topographique générative (GTM) et une nouvelle technique de visualisation appelée cartes d’arbres (TMAP)8. De plus, la collecte, l’évaluation et la diffusion de l’information chimique sur le NP dans les bases de données sur les composés sont l’une des utilisations de la chimio-informatique dans la recherche sur le NP. En revanche, avec l’introduction du big data, cela est particulièrement pertinent9.

Ici, les bases de données NP open source BIOFACQUIM10 et PeruNPDB11 sont utilisées pour décrire le protocole qui recherche la visualisation et la caractérisation de l’espace chimique des ensembles de données de composés naturels à l’aide de diverses représentations moléculaires, crée des représentations visuelles de ces espaces et étudie les relations structure-propriété dans les espaces chimiques, en mettant l’accent sur les applications de découverte de médicaments.

Protocole

1. Téléchargement et installation du logiciel

  1. Mettez à jour le répertoire de ce projet. Pour un accès pratique, placez les exécutables et les fichiers dans ce répertoire.
  2. Installez les progiciels requis après les avoir téléchargés.
  3. Téléchargez la dernière version du logiciel Osiris DataWarrior (OSIRIS), disponible à l’adresse https://openmolecules.org/datawarrior/
  4. Téléchargez la dernière version de la plateforme d’analyse The Konstanz Information Miner (KNIME), disponible à l’adresse https://www.knime.com/
  5. Téléchargez la dernière version du logiciel The GraphPad Prism, disponible à l’adresse https://www.graphpad.com/
    REMARQUE : Le logiciel Osiris DataWarrior et la plate-forme d’analyse The Konstanz Information Miner (KNIME) peuvent être utilisés sur un ordinateur personnel et sont gratuits pour un usage individuel, tandis que le logiciel GraphPad Prism peut être acheté à l’adresse (https://www.graphpad.com/).

2. Construction et conservation d’une base de données de composés

REMARQUE : Trouvez des substances et des sources qui contiennent les données nécessaires. Il est conseillé à l’utilisateur d’avoir les détails suivants pour chaque composé dans une feuille de calcul.

  1. Nommez chaque composé. Additionnez les noms de tous les composés décrits à la source dans la première colonne d’une feuille de calcul.
  2. Attribuez un code interne normalisé si vous créez une collection interne, ou attribuez un numéro qui identifie de manière unique ce composé dans la base de données consultée.
  3. Fournir l’entrée de structure à l’aide de la notation canonique SMILES, qui peut être importée dans d’autres outils d’édition moléculaire.
    1. Enregistrez la base de données idéalement dans .csv format une fois ces données rassemblées dans la feuille de calcul.
    2. Utilisez le logiciel OSIRIS pour générer les fichiers de données de structure (SDF), les fichiers de données moléculaires (mol) et les mol2 de l’ensemble de données, qui contiennent également des informations chimiques et sont interopérables avec la plupart des progiciels. Pour cela, téléchargez l’archive .csv en cliquant sur le bouton Fichier puis sur le bouton Ouvrir .
    3. Téléchargez l’ensemble de données sur la plateforme d’analyse KNIME afin d’améliorer la qualité des données et d’éviter les résultats inexacts. Pour cela, téléchargez le fichier .sdf ou .mol2 en cliquant sur le bouton Fichier, puis sur le bouton Ouvrir .
  4. Assurer l’uniformité des structures chimiques.
    1. Examinez chaque structure chimique pour vérifier les types d’atomes valides et les vérifications de valence. Standardisez les structures en les convertissant en une forme tautomérique canonique, en kekulisant les structures aromatiques, en normalisant le positionnement des liaisons stéréo et en transformant tous les hydrogènes implicites en hydrogènes explicites à l’aide du flux de travail de normalisation des structures moléculaires de KNIME.
    2. Trouvez et éliminez les doublons une fois que les molécules ont été correctement normalisées en utilisant le flux de travail de normalisation des structures moléculaires de KNIME. Utilisez les clés InChI comme notation linéaire pour localiser divers états de protonation et tautomères.
    3. Éliminez les doublons.
    4. Énumérer les tautomères et les stéréoisomères. Cette étape est cruciale dans les études de dépistage virtuel, en particulier lors de l’utilisation de méthodes de recherche telles que l’amarrage ou le filtrage basé sur les pharmacophores.

3. Descripteurs moléculaires et analyse de la diversité

REMARQUE : Les descripteurs moléculaires, tels que les qualités physicochimiques, les empreintes moléculaires et les échafaudages chimiques, sont les approches les plus courantes pour représenter les molécules dans les applications chimio-informatiques. Une analyse peut être effectuée ici : http://132.248.103.152:3838/PUMA/. Toutes les étapes décrites ci-dessous sont détaillées sur le site Web de PUMA.

  1. Calculez les six qualités physicochimiques les plus courantes de pertinence pharmacologique : masse moléculaire (MW), coefficient de partage octanol/eau (clogP), surface topologique (TPSA), solubilité aqueuse (clogS), nombre d’atomes donneurs de liaison H (HBD) et nombre d’atomes accepteurs de liaison H (HBA). Pour plus d’informations, consultez le site Web de PUMA.
  2. Calculez les clés MACCS 166 bits, la similitude Tanimoto par paire et les empreintes de connectivité étendue de diamètre 4 (ECFP4), ainsi que d’autres empreintes circulaires adaptées au criblage virtuel, à la modélisation du paysage d’activité et à la recherche sur les relations structure-activité (SAR).
  3. Calculez une statistique de tendance centrale pour chaque comparaison par paires. Assurez la diversité dans l’ensemble de données avec une moyenne ou une médiane plus petite, contrairement à la distance euclidienne ou à toute mesure de distance générale.
  4. Vérifiez si les valeurs calculées ont été enregistrées dans la littérature ou calculées pour d’autres bases de données de référence à des fins de comparaison. Pour cela, consultez des sites web tels que PubChem ou CHEMBL.
  5. Générez des tracés de violon pour la visualisation dans le logiciel GraphPad Prism, en affichant les valeurs maximales et minimales.

4. Visualisation de l’espace chimique

REMARQUE : Il est possible de condenser la majorité des données pertinentes en un petit nombre de variables à l’aide de l’ACP et d’autres techniques de réduction de la dimensionnalité. Les visualisations de l’espace chimique sont donc rendues possibles.

  1. Sélectionnez les six descripteurs pour déterminer la similitude ou la distance. Créez la matrice de similarité (ou de distance) en conséquence.
  2. Effectuez une analyse PCA sur la matrice. Sélectionnez deux ou trois composants principaux pour le traçage. Considérez la proportion de variance capturée par chaque composante primaire.
  3. Générez des représentations de nuages de points bidimensionnelles ou tridimensionnelles pour l’ACP à l’aide du nœud Plotly KNIME.

5. Graphiques de diversité consensuelle

REMARQUE : Des représentations visuelles ont été élaborées pour résumer quelques caractéristiques qui peuvent être utilisées pour quantifier la variété. L’analyse des diagrammes de diversité consensuelle (CDPs)12 peut être effectuée ici http://132.248.103.152:3838/CDPlots/.

  1. Créez un graphique avec le nombre de composés dans la base de données pour déterminer la taille du point de données. Utilisez la diversité des empreintes moléculaires pour l’axe des x, la diversité des échafaudages pour l’axe des y, la diversité basée sur les propriétés physicochimiques pour l’échelle continue des couleurs et le nombre relatif de composés dans l’ensemble de données pour la taille des points de données.
  2. Générez le tracé à plusieurs variables à l’aide du logiciel GraphPad Prism.

Résultats

Propriétés moléculaires et visualisation de l’espace chimique
Tous les composés des ensembles de données BIOFACQUIM10, PeruNPDB11 et FDA13 avaient six propriétés physicochimiques calculées pour eux. Ces qualités ont ensuite été tracées sur des graphiques à violon, qui permettent de voir comment les propriétés des trois ensembles de données étudiés sont distribuées (

Discussion

En raison de ses nombreuses utilisations potentielles, telles que la classification des composés, la sélection des composés, l’exploration des liens structure-activité et la navigation à travers les interactions structure-propriété, le concept d’espace chimique est aujourd’hui largement utilisé dans le processus de découverte et de développement de médicaments14. De plus, la création de bases de données NP est une procédure fondamentale pour ef...

Déclarations de divulgation

Les auteurs déclarent qu’ils n’ont aucun conflit d’intérêts.

Remerciements

HLBC et MACH remercient l’Universidad Catolica de Santa Maria pour leur financement (subventions 27499-R-2020, 27574-R-2020, 7309-CU-2020 et 28048-R-2021). JLMF remercie le financement de DGAPA, UNAM, Programa de Apoyo a Proyectos de Investigación e Innovación Tecnológica (PAPIIT), subvention No. IN201321.

matériels

NameCompanyCatalog NumberComments
GraphPad PrismGraphPad Prismhttps://www.graphpad.com/
KNIME platformKNIMEhttps://www.knime.com
Osiris DataWarrior (OSIRIS) softwareopenmolecules.orghttps://openmolecules.org/datawarrior/
PUMAPUMA: Platform for Unified Molecular Analysishttp://132.248.103.152:3838/PUMA/

Références

  1. Boufridi, A., Quinn, R. J. Harnessing the properties of natural products. Annu Rev Pharmacol Toxicol. 58, 451-470 (2018).
  2. Gómez-García, A., et al. Navigating the chemical space and chemical multiverse of a unified Latin American natural product database: LANaPDB. ChemRxiv. , (2023).
  3. Newman, D. J., Cragg, G. M. Natural products as sources of new drugs over the nearly four decades from 01/1981 to 09/2019. J Nat Prod. 83 (3), 770-803 (2020).
  4. Atanasov, A. G., Zotchev, S. B., Dirsch, V. M., Supuran, C. T. Natural products in drug discovery: advances and opportunities. Nat Rev Drug Discov. 20 (3), 200-216 (2021).
  5. Medina-Franco, J. L., Saldívar-González, F. I. Cheminformatics to characterize pharmacologically active natural products. Biomolecules. 10 (11), 1566 (2020).
  6. Chen, Y., Garcia De Lomana, M., Friedrich, N. O., Kirchmair, J. Characterization of the Chemical Space of Known and Readily Obtainable Natural Products. J Chem Inf Model. 58 (8), 1518-1532 (2018).
  7. Gaytán-Hernández, D., Chávez-Hernández, A. L., López-López, E., Miranda-Salas, J., Saldívar-González, F. I., Medina-Franco, J. L. Art driven by visual representations of chemical space. ChemRxiv. , (2023).
  8. Zabolotna, Y., Ertl, P., Horvath, D., Bonachera, F., Marcou, G., Varnek, A. NP Navigator: A new look at the natural product chemical space. Mol Inform. 40 (9), e2100068 (2021).
  9. Martinez-Mayorga, K., Madariaga-Mazon, A., Medina-Franco, J. L., Maggiora, G. The impact of chemoinformatics on drug discovery in the pharmaceutical industry. Expert Opin Drug Discov. 15 (3), 293-306 (2020).
  10. Pilón-Jiménez, B., Saldívar-González, F., Díaz-Eufracio, B., Medina-Franco, J. BIOFACQUIM: A Mexican compound database of natural products. Biomolecules. 9 (1), 31 (2019).
  11. Barazorda-Ccahuana, H. L., et al. PeruNPDB: the Peruvian natural products database for in silico drug screening. Sci Rep. 13 (1), 7577 (2023).
  12. González-Medina, M., Prieto-Martínez, F. D., Owen, J. R., Medina-Franco, J. L. Consensus diversity plots: a global diversity analysis of chemical libraries. J Cheminform. 8, 63 (2016).
  13. Irwin, J. J., et al. ZINC20-A free ultralarge-scale chemical database for ligand discovery. J Chem Inf Model. 60 (12), 6065-6073 (2020).
  14. Naveja, J. J., Medina-Franco, J. L. Finding constellations in chemical space through core analysis. Front Chem. 7, 510 (2019).
  15. Cavasotto, C. N., Di Filippo, J. I. Artificial intelligence in the early stages of drug discovery. Arch Biochem Biophys. 698, 108730 (2021).
  16. Rosén, J., Gottfries, J., Muresan, S., Backlund, A., Oprea, T. I. Novel chemical space exploration via natural products. J Med Chem. 52 (7), 1953-1962 (2009).
  17. Sliwoski, G., Kothiwale, S., Meiler, J., Lowe Jr, E. W. Computational methods in drug discovery. Pharmacol Rev. 66 (1), 334-395 (2014).
  18. Goyzueta-Mamani, L. D., Barazorda-Ccahuana, H. L., Mena-Ulecia, K., Chávez-Fumagalli, M. A. Antiviral activity of metabolites from Peruvian plants against SARS-CoV-2: An in silico approach. Molecules. 26 (13), 3882 (2021).
  19. Goyzueta-Mamani, L. D., et al. In silico analysis of metabolites from Peruvian native plants as potential therapeutics against Alzheimer's disease. Molecules. 27 (3), 918 (2022).
  20. Barazorda-Ccahuana, H. L., et al. Computer-aided drug design approaches applied to screen natural product's structural analogs targeting arginase in Leishmania spp. F1000Research. 12, 93 (2023).
  21. McGrady, M. Y., Colby, S. M., Nuñez, J. R., Renslow, R. S., Metz, T. O. AI for chemical space gap filling and novel compound generation. arXiv. , (2022).
  22. Medina-Franco, J., Martinez-Mayorga, K., Giulianotti, M., Houghten, R., Pinilla, C. Visualization of the chemical space in drug discovery. Curr Comput Aided-Drug Des. 4 (4), 322-333 (2008).
  23. Osolodkin, D. I., Radchenko, E. V., Orlov, A. A., Voronkov, A. E., Palyulin, V. A., Zefirov, N. S. Progress in visual representations of chemical space. Expert Opin Drug Discov. 10 (9), 959-973 (2015).
  24. Sheridan, R. P., Kearsley, S. K. Why do we need so many chemical similarity search methods. Drug Discov Today. 7 (17), 903-911 (2002).
  25. Singh, N., Guha, R., Giulianotti, M. A., Pinilla, C., Houghten, R. A., Medina-Franco, J. L. Chemoinformatic analysis of combinatorial libraries, drugs, natural products, and molecular libraries Small Molecule Repository. J Chem Inf Model. 49 (4), 1010-1024 (2009).
  26. Medina-Franco, J. L., Chávez-Hernández, A. L., López-López, E., Saldívar-González, F. I. Chemical multiverse: An expanded view of chemical space. Mol Inform. 41 (11), e2200116 (2022).

Réimpressions et Autorisations

Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE

Demande d’autorisation

Explorer plus d’articles

Espace chimiquebases de donn es sur les produits naturelsd couverte de m dicamentsentit s pharmacologiqueschimioinformatiquebioactivit sprofils d innocuitADMEressemblance des produits naturelsrepr sentations mol culairesrelations structure propri tBIOFACQUIMP rouNPDB

This article has been published

Video Coming Soon

JoVE Logo

Confidentialité

Conditions d'utilisation

Politiques

Recherche

Enseignement

À PROPOS DE JoVE

Copyright © 2025 MyJoVE Corporation. Tous droits réservés.