JoVE Logo

Oturum Aç

Bu içeriği görüntülemek için JoVE aboneliği gereklidir. Oturum açın veya ücretsiz deneme sürümünü başlatın.

Bu Makalede

  • Özet
  • Özet
  • Giriş
  • Protokol
  • Sonuçlar
  • Tartışmalar
  • Açıklamalar
  • Teşekkürler
  • Malzemeler
  • Referanslar
  • Yeniden Basımlar ve İzinler

Özet

Burada, ilaç keşfi ile ilgili uygulamalara odaklanarak, doğal bileşik veri setlerinin kimyasal uzayını görüntülemek ve analiz etmek için farklı moleküler temsiller kullanan bir metodoloji sunuyoruz.

Özet

Kimyasal uzay, tüm olası molekülleri kapsayan çok boyutlu bir tanımlayıcı uzaydır ve moleküler ağırlığı 500 Da'nın altında olan en az 1 x 1060 organik maddenin ilaç keşfi için potansiyel olarak ilgili olduğu düşünülmektedir. Doğal ürünler, son kırk yılda pazarlanan yeni farmakolojik varlıkların birincil kaynağı olmuştur ve yenilikçi ilaçların yaratılması için en verimli kaynaklardan biri olmaya devam etmektedir. Kemoinformatik tabanlı hesaplama araçları, doğal ürünler için ilaç geliştirme sürecini hızlandırır. Biyoaktivitelerin tahmini, güvenlik profilleri, ADME ve doğal ürün benzerliği ölçümünü içeren yöntemler kullanılmıştır. Burada, çeşitli moleküler temsilleri kullanarak doğal bileşik veri setlerinin kimyasal uzayını görselleştirmek, karakterize etmek ve genişletmek, bu tür uzayların görsel temsillerini oluşturmak ve kimyasal uzaylar içindeki yapı-özellik ilişkilerini araştırmak için tasarlanmış kemoinformatik araçlardaki son gelişmeleri gözden geçiriyoruz. İlaç keşif uygulamalarına vurgu yaparak, açık kaynaklı veritabanları BIOFACQUIM ve PeruNPDB'yi kavram kanıtı olarak değerlendiriyoruz.

Giriş

Canlılar tarafından oluşturulan kimyasal bileşikler olan doğal ürünler (NP'ler), yüzyıllardır geleneksel tedaviler olarak kullanılmaktadır. Bireysel NP'ler modern çağda ilaç olarak yaratılmış ve ilaç keşfinde kurşun bileşikler olarak başarılı bir şekilde kullanılmıştır1. İnsanlar ve hayvanlar tarafından oluşturulan deniz, mantar, bakteriyel, bitki ve endojen maddeler, çeşitli hayvanlar tarafından üretilen zehirler ve zehirler gibi biyoaktif bileşikler kategorisine dahil edilir2. Sonuç olarak, kırk yıl boyunca, NP'ler tarafından üretilen ilaçların sayısı, yeni farmakolojik maddelerin önemli bir kaynağını temsil etti3 ve NP'lerin, özellikle kanser ve bulaşıcı hastalıkların tedavisi için yeni ilaçların geliştirilmesinde ve ayrıca multipl skleroz ve kardiyovasküler hastalık gibi diğer terapötik durumlar için çok önemli olduğunu vurguladı4. Ayrıca, 1981 ve 2019 yılları arasında kanseri tedavi etmek için yetkilendirilmiş 185 küçük bileşiğin %64,9'u, modifiye edilmemiş NP'ler veya NP farmakofor3 içeren sentetik ilaçlardı.

Kimyasal uzay kavramına dayanan köklü bir disiplinler arası olan kemoinformatik, NP'lerin ilaç benzeri özelliklerle bağlantılı fizikokimyasal niteliklerinin kimyasal uzayını analiz etmek ve görselleştirmek için kullanılmıştır5. Kemoinformatik, NP'lere dayalı olarak ilaç tasarımı ve keşfi üzerinde önemli bir etki göstermiştir6. Bir grup bileşiğin kimyasal uzayı her zaman benzersiz değildir. Bu, onu tanımlamak için kullanılan tanımlayıcıların toplanmasına bağlı olacaktır, bu da NP'lerin kimyasal uzayını diğer herhangi bir bileşik seti olarak incelemenin, moleküler temsile dayanan belirli zorluklar sunduğu anlamına gelir7. Bu çabaya, çeşitli moleküler tanımlayıcılar ve veri görselleştirme teknikleri kullanılarak yaklaşılabilir. Buna karşılık, en sık kullanılan teknikler, temel bileşen analizi (PCA), iskele ağaçları, kendi kendini organize eden haritalar, üretken topografik haritalama (GTM) ve ağaç haritaları (TMAP'ler) adı verilen yeni bir görselleştirme tekniğidir8. Ayrıca, NP'nin kimyasal bilgilerinin bileşik veri tabanlarında toplanması, değerlendirilmesi ve yayılması, NP araştırmalarında kemoinformatiğin kullanımlarından biridir. Buna karşılık, büyük verinin tanıtılmasıyla birlikte, bu özellikle önemlidir9.

Burada, açık kaynaklı NP veritabanları BIOFACQUIM10 ve PeruNPDB11 , çeşitli moleküler temsilleri kullanarak doğal bileşik veri setlerinin kimyasal uzayının görselleştirilmesini ve karakterizasyonunu arayan, bu tür mekanların görsel temsillerini oluşturan ve ilaç keşif uygulamalarına vurgu yaparak kimyasal uzaylar içindeki yapı-özellik ilişkilerini araştıran protokolü tanımlamak için kullanılır.

Access restricted. Please log in or start a trial to view this content.

Protokol

1. Yazılım indirme ve yükleme

  1. Bu projenin dizinini yeni yapın. Kolay erişim için, yürütülebilir dosyaları ve dosyaları bu dizine koyun.
  2. Gerekli yazılım paketlerini indirdikten sonra yükleyin.
  3. The Osiris DataWarrior (OSIRIS) yazılımının en son sürümünü indirin ve bu sürüm https://openmolecules.org/datawarrior/
  4. Konstanz Information Miner (KNIME) Analytics Platform'un en son sürümünü indirin ve https://www.knime.com/
  5. adresinde bulunan GraphPad Prism yazılımının en son sürümünü indirin https://www.graphpad.com/
    NOT: Osiris DataWarrior yazılımı ve Konstanz Information Miner (KNIME) Analytics Platformu kişisel bir bilgisayarda kullanılabilir ve bireysel kullanım için ücretsizdir, GraphPad Prism yazılımı ise (https://www.graphpad.com/) adresinden satın alınabilir.

2. Bileşik bir veritabanının oluşturulması ve küratörlüğü

NOT: Gerekli verilere sahip maddeleri ve kaynakları bulun. Kullanıcının, bir elektronik tablodaki her bileşik için aşağıdaki ayrıntılara sahip olması önerilir.

  1. Her bileşiği adlandırın. Kaynakta açıklanan tüm bileşiklerin adlarını bir elektronik tablonun ilk sütununa ekleyin.
  2. Şirket içi bir koleksiyon oluşturuyorsanız dahili, standartlaştırılmış bir kod atayın veya danışılan veritabanında bu bileşiği benzersiz bir şekilde tanımlayan bir numara atayın.
  3. Diğer moleküler düzenleme araçlarına aktarılabilen kanonik SMILES notasyonunu kullanarak yapı girişini sağlayın.
    1. Bu veriler elektronik tabloda toplandıktan sonra veritabanını ideal olarak .csv biçiminde kaydedin.
    2. Veri kümesinin yapı veri dosyalarını (SDF), moleküler veri dosyasını (mol) ve mol2'yi oluşturmak için OSIRIS yazılımını kullanın, bunlar da kimyasal bilgiler içerir ve çoğu yazılım paketiyle birlikte çalışabilir. Bunun için File (Dosya ) butonuna ve ardından Open (Aç ) butonuna tıklayarak .csv arşivini yükleyiniz.
    3. Verilerin kalitesini artırmak ve hatalı sonuçları önlemek için veri kümesini KNIME analitik platformuna yükleyin. Bunun için Dosya düğmesine ve ardından düğmesine tıklayarak .sdf veya .mol2 dosyasını yükleyin.
  4. Kimyasal yapılarda homojenliği sağlayın.
    1. Geçerli atom türleri ve değerlik kontrolleri için her kimyasal yapıyı inceleyin. KNIME'nin Moleküler Yapıların Standardizasyonu iş akışını kullanarak yapıları kanonik bir totomerik forma dönüştürerek, aromatik yapıları kekülize ederek, stereo bağların konumlandırılmasını standartlaştırarak ve tüm örtük hidrojenleri açık hidrojenlere dönüştürerek standartlaştırın.
    2. KNIME'nin Moleküler Yapıların Standardize Edilmesi iş akışını kullanarak moleküller doğru bir şekilde standartlaştırıldıktan sonra kopyaları bulun ve ortadan kaldırın. Çeşitli protonasyon durumlarını ve tautomerleri bulmak için InChI tuşlarını doğrusal bir gösterim olarak kullanın.
    3. Yinelenenleri ortadan kaldırın.
    4. Tautomerleri ve stereoizomerleri numaralandırın. Bu adım, sanal tarama çalışmalarında, özellikle yerleştirme veya farmakofor bazlı filtreleme gibi arama yöntemleri kullanılırken çok önemlidir.

3. Moleküler tanımlayıcılar ve çeşitlilik analizi

NOT: Fizikokimyasal nitelikler ve moleküler parmak izleri ve kimyasal yapı iskeleleri gibi moleküler tanımlayıcılar, kemoinformatik uygulamalarda molekülleri temsil etmek için en yaygın yaklaşımlardır. Analiz burada yapılabilir: http://132.248.103.152:3838/PUMA/. Aşağıda açıklanan tüm adımlar PUMA web sitesinde ayrıntılı olarak açıklanmıştır.

  1. Farmakolojik alaka düzeyinin en yaygın altı fizikokimyasal özelliğini hesaplayın: moleküler ağırlık (MW), oktanol/su bölme katsayısı (clogP), topolojik yüzey alanı (TPSA), sulu çözünürlük (clogS), H-bağı donör atomlarının sayısı (HBD) ve H-bağı alıcı atomlarının sayısı (HBA). Daha fazla bilgi için PUMA web sitesine bakın.
  2. 166 bit MACCS anahtarlarını, ikili Tanimoto benzerliğini ve çap 4'ün (ECFP4) genişletilmiş bağlantı parmak izlerini ve sanal tarama, aktivite manzara modellemesi ve yapı-aktivite ilişkileri (SAR) araştırması için uygun diğer dairesel parmak izleriyle birlikte hesaplayın.
  3. Her ikili karşılaştırma için merkezi bir eğilim istatistiği hesaplayın. Öklid mesafesinin veya herhangi bir genel mesafe metriğinin aksine daha küçük bir ortalama veya medyan ile veri kümesindeki çeşitliliği sağlayın.
  4. Hesaplanan değerlerin literatüre kaydedilip kaydedilmediğini veya karşılaştırma amacıyla diğer referans veritabanları için hesaplanıp hesaplanmadığını kontrol edin. Bunun için PubChem veya CABBL gibi web sitelerine danışın.
  5. GraphPad Prism yazılımında görselleştirme için maksimum ve minimum değerleri görüntüleyen keman grafikleri oluşturun.

4. Kimyasal uzayın görselleştirilmesi

NOT: PCA ve diğer boyutsallık azaltma tekniklerini kullanarak ilgili verilerin çoğunu az sayıda değişkene yoğunlaştırmak mümkündür. Bu nedenle kimyasal uzayın görselleştirilmesi mümkün hale gelir.

  1. Benzerliği veya uzaklığı belirlemek için altı tanımlayıcının tümünü seçin. Benzerlik (veya mesafe) matrisini buna göre oluşturun.
  2. Matris üzerinde PCA analizi gerçekleştirin. Çizim için iki veya üç ana bileşen seçin. Her bir birincil bileşen tarafından yakalanan varyans oranını göz önünde bulundurun.
  3. Plotly KNIME düğümünü kullanarak PCA için iki veya üç boyutlu dağılım grafiği temsilleri oluşturun.

5. Konsensüs çeşitliliği grafikleri

NOT: Çeşitliliği ölçmek için kullanılabilecek birkaç özelliği özetlemek için görsel temsiller geliştirilmiştir. Konsensüs çeşitlilik grafikleri (CDP'ler)12 analizi burada http://132.248.103.152:3838/CDPlots/ gerçekleştirilebilir.

  1. Veri noktası boyutunu belirlemek için veritabanındaki bileşiklerin sayısıyla bir çizim oluşturun. X ekseni için moleküler parmak izlerinin çeşitliliğini, y ekseni için iskele çeşitliliğini, sürekli renk ölçeği için fizikokimyasal özelliklere dayalı çeşitliliği ve veri noktası boyutu için veri kümesindeki göreli bileşik sayısını kullanın.
  2. GraphPad Prism yazılımını kullanarak çok değişkenli grafiği oluşturun.

Access restricted. Please log in or start a trial to view this content.

Sonuçlar

Kimyasal uzayın moleküler özellikleri ve görselleştirilmesi
BIOFACQUIM10, PeruNPDB11 ve FDA13 veri setlerindeki tüm bileşikler, kendileri için hesaplanan altı fizikokimyasal özelliğe sahipti. Bu nitelikler daha sonra keman grafikleri üzerine çizildi, bu da incelenen üç veri setinin özelliklerinin nasıl dağıldığını görmeyi sağladı (Şekil 1). ...

Access restricted. Please log in or start a trial to view this content.

Tartışmalar

Bileşik sınıflandırması, bileşik seçimi, yapı-aktivite bağlantılarını keşfetme ve yapı-özellik etkileşimlerinde gezinme gibi birçok potansiyel kullanımı nedeniyle, kimyasal uzay kavramı günümüzde ilaç keşfi ve geliştirme sürecinde yaygın olarak kullanılmaktadır14. Ayrıca, NP veri tabanlarının oluşturulması, kimyasal bilgi miktarındaki artışın bir sonucu olarak, diğer çalışmaların yanı sıra, kimyasal kütüphanelerin ta...

Access restricted. Please log in or start a trial to view this content.

Açıklamalar

Yazarlar herhangi bir çıkar çatışması olmadığını beyan ederler.

Teşekkürler

HLBC ve MACH, Universidad Catolica de Santa Maria'nın finansmanına teşekkür eder (27499-R-2020, 27574-R-2020, 7309-CU-2020 ve 28048-R-2021 hibeleri). JLMF, DGAPA, UNAM, Programa de Apoyo a Proyectos de Investigación e Innovación Tecnológica'nın (PAPIIT) finansmanına teşekkür eder, hibe No. IN201321.

Access restricted. Please log in or start a trial to view this content.

Malzemeler

NameCompanyCatalog NumberComments
GraphPad PrismGraphPad Prismhttps://www.graphpad.com/
KNIME platformKNIMEhttps://www.knime.com
Osiris DataWarrior (OSIRIS) softwareopenmolecules.orghttps://openmolecules.org/datawarrior/
PUMAPUMA: Platform for Unified Molecular Analysishttp://132.248.103.152:3838/PUMA/

Referanslar

  1. Boufridi, A., Quinn, R. J. Harnessing the properties of natural products. Annu Rev Pharmacol Toxicol. 58, 451-470 (2018).
  2. Gómez-García, A., et al. Navigating the chemical space and chemical multiverse of a unified Latin American natural product database: LANaPDB. ChemRxiv. , (2023).
  3. Newman, D. J., Cragg, G. M. Natural products as sources of new drugs over the nearly four decades from 01/1981 to 09/2019. J Nat Prod. 83 (3), 770-803 (2020).
  4. Atanasov, A. G., Zotchev, S. B., Dirsch, V. M., Supuran, C. T. Natural products in drug discovery: advances and opportunities. Nat Rev Drug Discov. 20 (3), 200-216 (2021).
  5. Medina-Franco, J. L., Saldívar-González, F. I. Cheminformatics to characterize pharmacologically active natural products. Biomolecules. 10 (11), 1566(2020).
  6. Chen, Y., Garcia De Lomana, M., Friedrich, N. O., Kirchmair, J. Characterization of the Chemical Space of Known and Readily Obtainable Natural Products. J Chem Inf Model. 58 (8), 1518-1532 (2018).
  7. Gaytán-Hernández, D., Chávez-Hernández, A. L., López-López, E., Miranda-Salas, J., Saldívar-González, F. I., Medina-Franco, J. L. Art driven by visual representations of chemical space. ChemRxiv. , (2023).
  8. Zabolotna, Y., Ertl, P., Horvath, D., Bonachera, F., Marcou, G., Varnek, A. NP Navigator: A new look at the natural product chemical space. Mol Inform. 40 (9), e2100068(2021).
  9. Martinez-Mayorga, K., Madariaga-Mazon, A., Medina-Franco, J. L., Maggiora, G. The impact of chemoinformatics on drug discovery in the pharmaceutical industry. Expert Opin Drug Discov. 15 (3), 293-306 (2020).
  10. Pilón-Jiménez, B., Saldívar-González, F., Díaz-Eufracio, B., Medina-Franco, J. BIOFACQUIM: A Mexican compound database of natural products. Biomolecules. 9 (1), 31(2019).
  11. Barazorda-Ccahuana, H. L., et al. PeruNPDB: the Peruvian natural products database for in silico drug screening. Sci Rep. 13 (1), 7577(2023).
  12. González-Medina, M., Prieto-Martínez, F. D., Owen, J. R., Medina-Franco, J. L. Consensus diversity plots: a global diversity analysis of chemical libraries. J Cheminform. 8, 63(2016).
  13. Irwin, J. J., et al. ZINC20-A free ultralarge-scale chemical database for ligand discovery. J Chem Inf Model. 60 (12), 6065-6073 (2020).
  14. Naveja, J. J., Medina-Franco, J. L. Finding constellations in chemical space through core analysis. Front Chem. 7, 510(2019).
  15. Cavasotto, C. N., Di Filippo, J. I. Artificial intelligence in the early stages of drug discovery. Arch Biochem Biophys. 698, 108730(2021).
  16. Rosén, J., Gottfries, J., Muresan, S., Backlund, A., Oprea, T. I. Novel chemical space exploration via natural products. J Med Chem. 52 (7), 1953-1962 (2009).
  17. Sliwoski, G., Kothiwale, S., Meiler, J., Lowe Jr, E. W. Computational methods in drug discovery. Pharmacol Rev. 66 (1), 334-395 (2014).
  18. Goyzueta-Mamani, L. D., Barazorda-Ccahuana, H. L., Mena-Ulecia, K., Chávez-Fumagalli, M. A. Antiviral activity of metabolites from Peruvian plants against SARS-CoV-2: An in silico approach. Molecules. 26 (13), 3882(2021).
  19. Goyzueta-Mamani, L. D., et al. In silico analysis of metabolites from Peruvian native plants as potential therapeutics against Alzheimer's disease. Molecules. 27 (3), 918(2022).
  20. Barazorda-Ccahuana, H. L., et al. Computer-aided drug design approaches applied to screen natural product's structural analogs targeting arginase in Leishmania spp. F1000Research. 12, 93(2023).
  21. McGrady, M. Y., Colby, S. M., Nuñez, J. R., Renslow, R. S., Metz, T. O. AI for chemical space gap filling and novel compound generation. arXiv. , (2022).
  22. Medina-Franco, J., Martinez-Mayorga, K., Giulianotti, M., Houghten, R., Pinilla, C. Visualization of the chemical space in drug discovery. Curr Comput Aided-Drug Des. 4 (4), 322-333 (2008).
  23. Osolodkin, D. I., Radchenko, E. V., Orlov, A. A., Voronkov, A. E., Palyulin, V. A., Zefirov, N. S. Progress in visual representations of chemical space. Expert Opin Drug Discov. 10 (9), 959-973 (2015).
  24. Sheridan, R. P., Kearsley, S. K. Why do we need so many chemical similarity search methods. Drug Discov Today. 7 (17), 903-911 (2002).
  25. Singh, N., Guha, R., Giulianotti, M. A., Pinilla, C., Houghten, R. A., Medina-Franco, J. L. Chemoinformatic analysis of combinatorial libraries, drugs, natural products, and molecular libraries Small Molecule Repository. J Chem Inf Model. 49 (4), 1010-1024 (2009).
  26. Medina-Franco, J. L., Chávez-Hernández, A. L., López-López, E., Saldívar-González, F. I. Chemical multiverse: An expanded view of chemical space. Mol Inform. 41 (11), e2200116(2022).

Access restricted. Please log in or start a trial to view this content.

Yeniden Basımlar ve İzinler

Bu JoVE makalesinin metnini veya resimlerini yeniden kullanma izni talebi

Izin talebi

Daha Fazla Makale Keşfet

Kimyasal UzayDo al r n Veri Tabanlarla Ke fiFarmakolojik Varl klarKemoinformatikBiyoaktivitelerG venlik ProfilleriADMEDo al r n Benzerli iMolek ler TemsillerYap zellik li kileriBIOFACQUIMPeruNPDB

This article has been published

Video Coming Soon

JoVE Logo

Gizlilik

Kullanım Şartları

İlkeler

Araştırma

Eğitim

JoVE Hakkında

Telif Hakkı © 2020 MyJove Corporation. Tüm hakları saklıdır