JoVE Logo

Accedi

È necessario avere un abbonamento a JoVE per visualizzare questo. Accedi o inizia la tua prova gratuita.

In questo articolo

  • Riepilogo
  • Abstract
  • Introduzione
  • Protocollo
  • Risultati
  • Discussione
  • Divulgazioni
  • Riconoscimenti
  • Materiali
  • Riferimenti
  • Ristampe e Autorizzazioni

Riepilogo

Qui, forniamo una metodologia che utilizza diverse rappresentazioni molecolari per visualizzare e analizzare lo spazio chimico dei set di dati dei composti naturali, con particolare attenzione alle applicazioni relative alla scoperta di farmaci.

Abstract

Lo spazio chimico è uno spazio descrittore multidimensionale che racchiude tutte le possibili molecole, e si ritiene che almeno 1 x 1060 sostanze organiche con un peso molecolare inferiore a 500 Da siano potenzialmente rilevanti per la scoperta di farmaci. I prodotti naturali sono stati la fonte primaria delle nuove entità farmacologiche commercializzate negli ultimi quarant'anni e continuano ad essere una delle fonti più produttive per la creazione di farmaci innovativi. Gli strumenti computazionali basati sulla chemioinformatica accelerano il processo di sviluppo di farmaci per prodotti naturali. Sono stati utilizzati metodi che includono la stima delle bioattività, i profili di sicurezza, l'ADME e la misurazione della somiglianza dei prodotti naturali. Qui, esaminiamo i recenti sviluppi negli strumenti chemioinformatici progettati per visualizzare, caratterizzare ed espandere lo spazio chimico di set di dati di composti naturali utilizzando varie rappresentazioni molecolari, creare rappresentazioni visive di tali spazi e studiare le relazioni struttura-proprietà all'interno degli spazi chimici. Con un'enfasi sulle applicazioni di scoperta di farmaci, valutiamo i database open source BIOFACQUIM e PeruNPDB come prova di concetto.

Introduzione

I prodotti naturali (NP), che sono composti chimici creati dagli esseri viventi, sono stati utilizzati come trattamenti tradizionali per secoli. Le singole NP sono state create come farmaci nell'era moderna e sfruttate con successo come composti guida nella scoperta di farmaci1. Le sostanze marine, fungine, batteriche, vegetali ed endogene create dall'uomo e dagli animali sono incluse nella categoria dei composti bioattivi, così come i veleni e i veleni prodotti da vari animali2. Di conseguenza, per quarant'anni, il numero di farmaci prodotti dalle NP ha rappresentato una fonte significativa di nuove sostanze farmacologiche3, sottolineando che le NP sono state cruciali nello sviluppo di nuovi farmaci, in particolare per il trattamento del cancro e delle malattie infettive, nonché per altre condizioni terapeutiche come la sclerosi multipla e le malattie cardiovascolari4. Inoltre, il 64,9% dei 185 piccoli composti autorizzati per il trattamento del cancro tra il 1981 e il 2019 erano NP non modificati o farmaci sintetici con un farmacoforoNP 3.

La chemioinformatica, un'interdisciplinarietà ben consolidata che si basa sul concetto di spazio chimico, è stata utilizzata per analizzare e visualizzare lo spazio chimico delle qualità fisico-chimiche delle NP legate a tratti farmaco-simili5. La chemioinformatica ha dimostrato un impatto sostanziale sulla progettazione e la scoperta di farmaci basati su NP6. Lo spazio chimico di un gruppo di composti non è sempre unico. Dipenderà dall'insieme di descrittori utilizzati per definirlo, il che significa che lo studio dello spazio chimico delle NP come qualsiasi altro insieme di composti, presenta sfide particolari che si basano sulla rappresentazione molecolare7. Questo sforzo può essere affrontato utilizzando una varietà di descrittori molecolari e tecniche di visualizzazione dei dati. Al contrario, le tecniche più utilizzate sono l'analisi delle componenti principali (PCA), gli alberi delle impalcature, le mappe auto-organizzanti, la mappatura topografica generativa (GTM) e una nuova tecnica di visualizzazione chiamata mappe ad albero (TMAP)8. Inoltre, la raccolta, la valutazione e la diffusione delle informazioni chimiche delle NP nei database dei composti è uno degli usi della chemioinformatica nella ricerca sulle NP. Al contrario, con l'introduzione dei big data, questo è particolarmente pertinente9.

Qui, i database NP open-source BIOFACQUIM10 e PeruNPDB11 sono utilizzati per descrivere il protocollo che cerca la visualizzazione e la caratterizzazione dello spazio chimico di set di dati di composti naturali utilizzando varie rappresentazioni molecolari, crea rappresentazioni visive di tali spazi e studia le relazioni struttura-proprietà all'interno degli spazi chimici, con particolare attenzione alle applicazioni di scoperta di farmaci.

Access restricted. Please log in or start a trial to view this content.

Protocollo

1. Download e installazione del software

  1. Aggiorna la directory di questo progetto. Per un accesso conveniente, inserire gli eseguibili e i file in questa directory.
  2. Installa i pacchetti software richiesti dopo averli scaricati.
  3. Scarica l'ultima versione del software The Osiris DataWarrior (OSIRIS), disponibile all'indirizzo https://openmolecules.org/datawarrior/
  4. Scarica l'ultima versione della piattaforma di analisi The Konstanz Information Miner (KNIME), disponibile all'indirizzo https://www.knime.com/
  5. Scarica l'ultima versione del software The GraphPad Prism, disponibile all'indirizzo https://www.graphpad.com/
    NOTA: Il software Osiris DataWarrior e la piattaforma di analisi Konstanz Information Miner (KNIME) possono essere utilizzati su un personal computer e sono gratuiti per uso individuale, mentre il software GraphPad Prism può essere acquistato all'indirizzo (https://www.graphpad.com/).

2. Costruzione e cura di un database composto

NOTA: Trova sostanze e fonti che dispongano dei dati necessari. Si consiglia all'utente di avere i seguenti dettagli per ogni composto in un foglio di calcolo.

  1. Assegna un nome a ciascun composto. Aggiungi i nomi di tutti i composti descritti alla fonte nella prima colonna di un foglio di calcolo.
  2. Assegna un codice interno standardizzato se crei una collezione interna, oppure assegna un numero che identifichi in modo univoco questo composto nel database consultato.
  3. Fornisci l'input della struttura utilizzando la notazione canonica SMILES, che può essere importata in altri strumenti di editing molecolare.
    1. Salvare il database idealmente in formato .csv una volta raccolti questi dati nel foglio di calcolo.
    2. Utilizza il software OSIRIS per generare i file di dati della struttura del set di dati (SDF), il file di dati molecolari (mol) e mol2, che contengono anche informazioni chimiche e sono interoperabili con la maggior parte dei pacchetti software. Per questo, carica l'archivio .csv facendo clic sul pulsante File e poi sul pulsante Apri .
    3. Carica il set di dati sulla piattaforma di analisi KNIME per migliorare la qualità dei dati ed evitare risultati imprecisi. A tale scopo, caricare il file .sdf o .mol2 facendo clic sul pulsante File e quindi sul pulsante Apri .
  4. Garantire l'uniformità delle strutture chimiche.
    1. Esaminare ogni struttura chimica per verificare la validità dei tipi di atomi e dei controlli di valenza. Standardizzare le strutture convertendole in una forma tautomerica canonica, kekulizzando le strutture aromatiche, standardizzando il posizionamento dei legami stereo e trasformando tutti gli idrogeni impliciti in idrogeni espliciti utilizzando il flusso di lavoro Standardizing Molecular Structures di KNIME.
    2. Trova ed elimina i duplicati dopo che le molecole sono state correttamente standardizzate utilizzando il flusso di lavoro Standardizing Molecular Structures di KNIME. Utilizza i tasti InChI come notazione lineare per individuare vari stati di protonazione e tautomeri.
    3. Elimina i duplicati.
    4. Enumerare tautomeri e stereoisomeri. Questo passaggio è fondamentale negli studi di screening virtuale, soprattutto quando si utilizzano metodi di ricerca come il docking o il filtraggio basato su farmacofori.

3. Descrittori molecolari e analisi della diversità

NOTA: I descrittori molecolari, come le qualità fisico-chimiche, le impronte digitali molecolari e gli scaffold chimici, sono gli approcci più comuni per rappresentare le molecole nelle applicazioni chemioinformatiche. L'analisi può essere eseguita qui: http://132.248.103.152:3838/PUMA/. Tutti i passaggi descritti di seguito sono descritti in dettaglio sul sito web PUMA.

  1. Calcolare le sei qualità fisico-chimiche più diffuse di rilevanza farmacologica: peso molecolare (MW), coefficiente di ripartizione ottanolo/acqua (clogP), superficie topologica (TPSA), solubilità acquosa (clogS), numero di atomi donatori di legami H (HBD) e numero di atomi accettori di legami H (HBA). Per ulteriori informazioni, consulta il sito web PUMA.
  2. Calcola le chiavi MACCS a 166 bit, la somiglianza di Tanimoto a coppie e le impronte digitali di connettività estesa di diametro 4 (ECFP4), insieme ad altre impronte digitali circolari adatte per lo screening virtuale, la modellazione del panorama delle attività e la ricerca sulle relazioni struttura-attività (SAR).
  3. Calcola una statistica di tendenza centrale per ogni confronto a coppie. Garantire la diversità nel set di dati con una media o una mediana più piccola contrariamente alla distanza euclidea o a qualsiasi metrica di distanza generale.
  4. Verificare se i valori calcolati sono stati registrati in letteratura o calcolati per altre banche dati di riferimento a scopo di confronto. Per questo, consulta siti web come PubChem o CHEMBL.
  5. Genera grafici a violino per la visualizzazione all'interno del software GraphPad Prism, visualizzando i valori massimi e minimi.

4. Visualizzazione dello spazio chimico

NOTA: È possibile condensare la maggior parte dei dati pertinenti in un piccolo numero di variabili utilizzando la PCA e altre tecniche di riduzione della dimensionalità. In questo modo è possibile visualizzare lo spazio chimico.

  1. Seleziona tutti e sei i descrittori per determinare la somiglianza o la distanza. Crea la matrice di somiglianza (o distanza) di conseguenza.
  2. Eseguire l'analisi PCA sulla matrice. Selezionare due o tre componenti principali per la stampa. Considera la proporzione di varianza catturata da ciascun componente primario.
  3. Genera rappresentazioni a dispersione bidimensionali o tridimensionali per PCA utilizzando il nodo KNIME di Plotly.

5. Grafici di diversità del consenso

NOTA: Le rappresentazioni visive sono state sviluppate per riassumere alcune caratteristiche che possono essere utilizzate per quantificare la varietà. L'analisi dei grafici della diversità di consenso (CDP)12 può essere eseguita qui http://132.248.103.152:3838/CDPlots/.

  1. Creare un grafico con il numero di composti nel database per determinare la dimensione del punto dati. Utilizza la diversità delle impronte digitali molecolari per l'asse x, la diversità degli scaffold per l'asse y, la diversità basata sulle proprietà fisico-chimiche per la scala continua del colore e il numero relativo di composti nel set di dati per la dimensione dei punti dati.
  2. Genera il grafico a più variabili utilizzando il software GraphPad Prism.

Access restricted. Please log in or start a trial to view this content.

Risultati

Proprietà molecolari e visualizzazione dello spazio chimico
Tutti i composti nei set di dati BIOFACQUIM10, PeruNPDB11 e FDA13 avevano sei proprietà fisico-chimiche calcolate per loro. Queste qualità sono state poi tracciate su grafici a violino, che consentono di vedere come sono distribuite le proprietà dei tre set di dati studiati (Figura 1). I profili di distri...

Access restricted. Please log in or start a trial to view this content.

Discussione

A causa dei suoi numerosi usi potenziali, come la classificazione dei composti, la selezione dei composti, l'esplorazione dei legami struttura-attività e la navigazione attraverso le interazioni struttura-proprietà, il concetto di spazio chimico è oggi ampiamente impiegato nel processo di scoperta e sviluppo di farmaci14. Inoltre, la creazione di database NP è una procedura fondamentale per eseguire vari studi computazionali, tra cui la progettazione di librer...

Access restricted. Please log in or start a trial to view this content.

Divulgazioni

Gli autori dichiarano di non avere alcun conflitto di interessi.

Riconoscimenti

HLBC e MACH ringraziano il finanziamento dell'Universidad Catolica de Santa Maria (sovvenzioni 27499-R-2020, 27574-R-2020, 7309-CU-2020 e 28048-R-2021). JLMF ringrazia il finanziamento di DGAPA, UNAM, Programa de Apoyo a Proyectos de Investigación e Innovación Tecnológica (PAPIIT), grant No. IN201321.

Access restricted. Please log in or start a trial to view this content.

Materiali

NameCompanyCatalog NumberComments
GraphPad PrismGraphPad Prismhttps://www.graphpad.com/
KNIME platformKNIMEhttps://www.knime.com
Osiris DataWarrior (OSIRIS) softwareopenmolecules.orghttps://openmolecules.org/datawarrior/
PUMAPUMA: Platform for Unified Molecular Analysishttp://132.248.103.152:3838/PUMA/

Riferimenti

  1. Boufridi, A., Quinn, R. J. Harnessing the properties of natural products. Annu Rev Pharmacol Toxicol. 58, 451-470 (2018).
  2. Gómez-García, A., et al. Navigating the chemical space and chemical multiverse of a unified Latin American natural product database: LANaPDB. ChemRxiv. , (2023).
  3. Newman, D. J., Cragg, G. M. Natural products as sources of new drugs over the nearly four decades from 01/1981 to 09/2019. J Nat Prod. 83 (3), 770-803 (2020).
  4. Atanasov, A. G., Zotchev, S. B., Dirsch, V. M., Supuran, C. T. Natural products in drug discovery: advances and opportunities. Nat Rev Drug Discov. 20 (3), 200-216 (2021).
  5. Medina-Franco, J. L., Saldívar-González, F. I. Cheminformatics to characterize pharmacologically active natural products. Biomolecules. 10 (11), 1566(2020).
  6. Chen, Y., Garcia De Lomana, M., Friedrich, N. O., Kirchmair, J. Characterization of the Chemical Space of Known and Readily Obtainable Natural Products. J Chem Inf Model. 58 (8), 1518-1532 (2018).
  7. Gaytán-Hernández, D., Chávez-Hernández, A. L., López-López, E., Miranda-Salas, J., Saldívar-González, F. I., Medina-Franco, J. L. Art driven by visual representations of chemical space. ChemRxiv. , (2023).
  8. Zabolotna, Y., Ertl, P., Horvath, D., Bonachera, F., Marcou, G., Varnek, A. NP Navigator: A new look at the natural product chemical space. Mol Inform. 40 (9), e2100068(2021).
  9. Martinez-Mayorga, K., Madariaga-Mazon, A., Medina-Franco, J. L., Maggiora, G. The impact of chemoinformatics on drug discovery in the pharmaceutical industry. Expert Opin Drug Discov. 15 (3), 293-306 (2020).
  10. Pilón-Jiménez, B., Saldívar-González, F., Díaz-Eufracio, B., Medina-Franco, J. BIOFACQUIM: A Mexican compound database of natural products. Biomolecules. 9 (1), 31(2019).
  11. Barazorda-Ccahuana, H. L., et al. PeruNPDB: the Peruvian natural products database for in silico drug screening. Sci Rep. 13 (1), 7577(2023).
  12. González-Medina, M., Prieto-Martínez, F. D., Owen, J. R., Medina-Franco, J. L. Consensus diversity plots: a global diversity analysis of chemical libraries. J Cheminform. 8, 63(2016).
  13. Irwin, J. J., et al. ZINC20-A free ultralarge-scale chemical database for ligand discovery. J Chem Inf Model. 60 (12), 6065-6073 (2020).
  14. Naveja, J. J., Medina-Franco, J. L. Finding constellations in chemical space through core analysis. Front Chem. 7, 510(2019).
  15. Cavasotto, C. N., Di Filippo, J. I. Artificial intelligence in the early stages of drug discovery. Arch Biochem Biophys. 698, 108730(2021).
  16. Rosén, J., Gottfries, J., Muresan, S., Backlund, A., Oprea, T. I. Novel chemical space exploration via natural products. J Med Chem. 52 (7), 1953-1962 (2009).
  17. Sliwoski, G., Kothiwale, S., Meiler, J., Lowe Jr, E. W. Computational methods in drug discovery. Pharmacol Rev. 66 (1), 334-395 (2014).
  18. Goyzueta-Mamani, L. D., Barazorda-Ccahuana, H. L., Mena-Ulecia, K., Chávez-Fumagalli, M. A. Antiviral activity of metabolites from Peruvian plants against SARS-CoV-2: An in silico approach. Molecules. 26 (13), 3882(2021).
  19. Goyzueta-Mamani, L. D., et al. In silico analysis of metabolites from Peruvian native plants as potential therapeutics against Alzheimer's disease. Molecules. 27 (3), 918(2022).
  20. Barazorda-Ccahuana, H. L., et al. Computer-aided drug design approaches applied to screen natural product's structural analogs targeting arginase in Leishmania spp. F1000Research. 12, 93(2023).
  21. McGrady, M. Y., Colby, S. M., Nuñez, J. R., Renslow, R. S., Metz, T. O. AI for chemical space gap filling and novel compound generation. arXiv. , (2022).
  22. Medina-Franco, J., Martinez-Mayorga, K., Giulianotti, M., Houghten, R., Pinilla, C. Visualization of the chemical space in drug discovery. Curr Comput Aided-Drug Des. 4 (4), 322-333 (2008).
  23. Osolodkin, D. I., Radchenko, E. V., Orlov, A. A., Voronkov, A. E., Palyulin, V. A., Zefirov, N. S. Progress in visual representations of chemical space. Expert Opin Drug Discov. 10 (9), 959-973 (2015).
  24. Sheridan, R. P., Kearsley, S. K. Why do we need so many chemical similarity search methods. Drug Discov Today. 7 (17), 903-911 (2002).
  25. Singh, N., Guha, R., Giulianotti, M. A., Pinilla, C., Houghten, R. A., Medina-Franco, J. L. Chemoinformatic analysis of combinatorial libraries, drugs, natural products, and molecular libraries Small Molecule Repository. J Chem Inf Model. 49 (4), 1010-1024 (2009).
  26. Medina-Franco, J. L., Chávez-Hernández, A. L., López-López, E., Saldívar-González, F. I. Chemical multiverse: An expanded view of chemical space. Mol Inform. 41 (11), e2200116(2022).

Access restricted. Please log in or start a trial to view this content.

Ristampe e Autorizzazioni

Richiedi autorizzazione per utilizzare il testo o le figure di questo articolo JoVE

Richiedi Autorizzazione

Esplora altri articoli

Spazio ChimicoBanche Dati di Prodotti NaturaliScoperta FarmacologicaEntit FarmacologicheChemioinformaticaBioattivitProfili di SicurezzaADMESomiglianza di Prodotti NaturaliRappresentazioni MolecolariRelazioni Struttura ProprietBIOFACQUIMPer NPDB

This article has been published

Video Coming Soon

JoVE Logo

Riservatezza

Condizioni di utilizzo

Politiche

Ricerca

Didattica

CHI SIAMO

Copyright © 2025 MyJoVE Corporation. Tutti i diritti riservati