Un abonnement à JoVE est nécessaire pour voir ce contenu. Connectez-vous ou commencez votre essai gratuit.
Method Article
Ici, nous proposons une méthodologie qui utilise différentes représentations moléculaires pour afficher et analyser l’espace chimique des ensembles de données de composés naturels, en mettant l’accent sur les applications liées à la découverte de médicaments.
L’espace chimique est un espace descripteur multidimensionnel qui englobe toutes les molécules possibles, et au moins 1 x 1060 substances organiques d’un poids moléculaire inférieur à 500 Da sont considérées comme potentiellement pertinentes pour la découverte de médicaments. Les produits naturels ont été la principale source des nouvelles entités pharmacologiques commercialisées au cours des quarante dernières années et continuent d’être l’une des sources les plus productives pour la création de médicaments innovants. Les outils informatiques basés sur la chimiothérapie accélèrent le processus de développement de médicaments pour les produits naturels. Des méthodes telles que l’estimation des bioactivités, les profils d’innocuité, l’ADME et la mesure de la ressemblance naturelle des produits ont été utilisées. Ici, nous passons en revue les développements récents d’outils chimioinformatiques conçus pour visualiser, caractériser et élargir l’espace chimique des ensembles de données de composés naturels à l’aide de diverses représentations moléculaires, créer des représentations visuelles de ces espaces et étudier les relations structure-propriété au sein des espaces chimiques. En mettant l’accent sur les applications de découverte de médicaments, nous évaluons les bases de données open source BIOFACQUIM et PeruNPDB comme preuve de concept.
Les produits naturels (NP), qui sont des composés chimiques créés par des êtres vivants, sont utilisés comme traitements traditionnels depuis des siècles. Les NP individuelles ont été créées comme médicaments à l’ère moderne et exploitées avec succès comme composés phares dans la découverte de médicaments1. Les substances marines, fongiques, bactériennes, végétales et endogènes créées par les humains et les animaux sont incluses dans la catégorie des composés bioactifs, tout comme les venins et les poisons produits par divers animaux2. En conséquence, pendant quarante ans, le nombre de médicaments fabriqués par les IP a représenté une source importante de nouvelles substances pharmacologiques3, soulignant que les IP ont joué un rôle crucial dans le développement de nouveaux médicaments, en particulier pour le traitement du cancer et des maladies infectieuses, ainsi que pour d’autres conditions thérapeutiques comme la sclérose en plaques et les maladies cardiovasculaires4. De plus, 64,9 % des 185 petits composés autorisés pour traiter le cancer entre 1981 et 2019 étaient des NP non modifiés ou des médicaments synthétiques avec un pharmacophore NP3.
La chimioinformatique, une interdiscipline bien établie qui repose sur le concept d’espace chimique, a été utilisée pour analyser et visualiser l’espace chimique des qualités physicochimiques des NP liées à des traits pseudo-médicamenteux5. La chimio-informatique a montré un impact substantiel sur la conception et la découverte de médicaments basés sur les NPs6. L’espace chimique d’un groupe de composés n’est pas toujours unique. Cela dépendra de l’ensemble des descripteurs utilisés pour le définir, ce qui signifie que l’étude de l’espace chimique des NP comme de tout autre ensemble de composés, présente des défis particuliers qui reposent sur la représentation moléculaire7. Cette entreprise peut être abordée à l’aide d’une variété de descripteurs moléculaires et de techniques de visualisation de données. En revanche, les techniques les plus souvent utilisées sont l’analyse en composantes principales (ACP), les arbres d’échafaudage, les cartes auto-organisées, la cartographie topographique générative (GTM) et une nouvelle technique de visualisation appelée cartes d’arbres (TMAP)8. De plus, la collecte, l’évaluation et la diffusion de l’information chimique sur le NP dans les bases de données sur les composés sont l’une des utilisations de la chimio-informatique dans la recherche sur le NP. En revanche, avec l’introduction du big data, cela est particulièrement pertinent9.
Ici, les bases de données NP open source BIOFACQUIM10 et PeruNPDB11 sont utilisées pour décrire le protocole qui recherche la visualisation et la caractérisation de l’espace chimique des ensembles de données de composés naturels à l’aide de diverses représentations moléculaires, crée des représentations visuelles de ces espaces et étudie les relations structure-propriété dans les espaces chimiques, en mettant l’accent sur les applications de découverte de médicaments.
1. Téléchargement et installation du logiciel
2. Construction et conservation d’une base de données de composés
REMARQUE : Trouvez des substances et des sources qui contiennent les données nécessaires. Il est conseillé à l’utilisateur d’avoir les détails suivants pour chaque composé dans une feuille de calcul.
3. Descripteurs moléculaires et analyse de la diversité
REMARQUE : Les descripteurs moléculaires, tels que les qualités physicochimiques, les empreintes moléculaires et les échafaudages chimiques, sont les approches les plus courantes pour représenter les molécules dans les applications chimio-informatiques. Une analyse peut être effectuée ici : http://132.248.103.152:3838/PUMA/. Toutes les étapes décrites ci-dessous sont détaillées sur le site Web de PUMA.
4. Visualisation de l’espace chimique
REMARQUE : Il est possible de condenser la majorité des données pertinentes en un petit nombre de variables à l’aide de l’ACP et d’autres techniques de réduction de la dimensionnalité. Les visualisations de l’espace chimique sont donc rendues possibles.
5. Graphiques de diversité consensuelle
REMARQUE : Des représentations visuelles ont été élaborées pour résumer quelques caractéristiques qui peuvent être utilisées pour quantifier la variété. L’analyse des diagrammes de diversité consensuelle (CDPs)12 peut être effectuée ici http://132.248.103.152:3838/CDPlots/.
Propriétés moléculaires et visualisation de l’espace chimique
Tous les composés des ensembles de données BIOFACQUIM10, PeruNPDB11 et FDA13 avaient six propriétés physicochimiques calculées pour eux. Ces qualités ont ensuite été tracées sur des graphiques à violon, qui permettent de voir comment les propriétés des trois ensembles de données étudiés sont distribuées (
En raison de ses nombreuses utilisations potentielles, telles que la classification des composés, la sélection des composés, l’exploration des liens structure-activité et la navigation à travers les interactions structure-propriété, le concept d’espace chimique est aujourd’hui largement utilisé dans le processus de découverte et de développement de médicaments14. De plus, la création de bases de données NP est une procédure fondamentale pour ef...
Les auteurs déclarent qu’ils n’ont aucun conflit d’intérêts.
HLBC et MACH remercient l’Universidad Catolica de Santa Maria pour leur financement (subventions 27499-R-2020, 27574-R-2020, 7309-CU-2020 et 28048-R-2021). JLMF remercie le financement de DGAPA, UNAM, Programa de Apoyo a Proyectos de Investigación e Innovación Tecnológica (PAPIIT), subvention No. IN201321.
Name | Company | Catalog Number | Comments |
GraphPad Prism | GraphPad Prism | https://www.graphpad.com/ | |
KNIME platform | KNIME | https://www.knime.com | |
Osiris DataWarrior (OSIRIS) software | openmolecules.org | https://openmolecules.org/datawarrior/ | |
PUMA | PUMA: Platform for Unified Molecular Analysis | http://132.248.103.152:3838/PUMA/ |
Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE
Demande d’autorisationThis article has been published
Video Coming Soon