JoVE Logo

Sign In

A subscription to JoVE is required to view this content. Sign in or start your free trial.

In This Article

  • Summary
  • Abstract
  • Introduction
  • Protocol
  • النتائج
  • Discussion
  • Disclosures
  • Acknowledgements
  • Materials
  • References
  • Reprints and Permissions

Summary

هنا ، نقدم منهجية تستخدم تمثيلات جزيئية مختلفة لعرض وتحليل المساحة الكيميائية لمجموعات بيانات المركبات الطبيعية ، مع التركيز على التطبيقات المتعلقة باكتشاف الأدوية.

Abstract

الفضاء الكيميائي هو فضاء واصف متعدد الأبعاد يحيط بجميع الجزيئات الممكنة ، ويعتقد أن ما لا يقل عن 1 × 1060 مادة عضوية ذات وزن جزيئي أقل من 500 دالتون يمكن أن تكون ذات صلة باكتشاف الأدوية. كانت المنتجات الطبيعية المصدر الرئيسي للكيانات الدوائية الجديدة التي تم تسويقها خلال الأربعين عاما الماضية ولا تزال واحدة من أكثر المصادر إنتاجية لإنشاء الأدوية المبتكرة. تعمل الأدوات الحسابية القائمة على المعلوماتية الكيميائية على تسريع عملية تطوير الأدوية للمنتجات الطبيعية. تم استخدام طرق بما في ذلك تقدير الأنشطة الحيوية ، وملامح السلامة ، و ADME ، وقياس تشابه المنتج الطبيعي. هنا ، نراجع التطورات الأخيرة في أدوات المعلوماتية الكيميائية المصممة لتصور وتوصيف وتوسيع الفضاء الكيميائي لمجموعات بيانات المركبات الطبيعية باستخدام تمثيلات جزيئية مختلفة ، وإنشاء تمثيلات مرئية لمثل هذه المساحات ، والتحقيق في علاقات البنية والخاصية داخل المساحات الكيميائية. مع التركيز على تطبيقات اكتشاف الأدوية ، نقوم بتقييم قواعد البيانات مفتوحة المصدر BIOFACQUIM و PeruNPDB كدليل على المفهوم.

Introduction

تم استخدام المنتجات الطبيعية (NPs) ، وهي مركبات كيميائية تم إنشاؤها بواسطة الكائنات الحية ، كعلاجات تقليدية لعدة قرون. تم إنشاء NPs الفردية كأدوية في العصر الحديث وتم استغلالها بنجاح كمركبات رصاص في اكتشاف الأدوية1. يتم تضمين المواد البحرية والفطرية والبكتيرية والنباتية والذاتية التي أنشأها البشر في فئة المركبات النشطة بيولوجيا ، وكذلك السموم والسموم التي تنتجها المختلفة2. نتيجة لذلك ، على مدى أربعين عاما ، مثل عدد الأدوية التي تصنعها NPs مصدرا مهما للمواد الدوائية الجديدة3 ، مع التأكيد على أن NPs كانت حاسمة في تطوير أدوية جديدة ، خاصة لعلاج السرطان والأمراض المعدية ، وكذلك للحالات العلاجية الأخرى مثل التصلب المتعدد وأمراض القلبوالأوعية الدموية 4. علاوة على ذلك ، فإن 64.9٪ من 185 مركبا صغيرا تم ترخيصها لعلاج السرطان بين عامي 1981 و 2019 كانت NPs غير معدلة أو أدوية اصطناعية تحتوي على NP pharmacophore3.

تم استخدام المعلوماتية الكيميائية ، وهي تخصص متعدد التخصصات راسخ يعتمد على مفهوم الفضاء الكيميائي ، لتحليل وتصور الفضاء الكيميائي للصفات الفيزيائية والكيميائية ل NPs المرتبطة بسمات شبيهةبالأدوية 5. أظهرت المعلوماتية الكيميائية تأثيرا كبيرا على تصميم الأدوية واكتشافها بناء على NPs6. المساحة الكيميائية لمجموعة من المركبات ليست فريدة دائما. سيعتمد على مجموعة الواصفات المستخدمة لتعريفه ، مما يعني أن دراسة الفضاء الكيميائي ل NPs مثل أي مجموعة أخرى من المركبات ، تمثل تحديات خاصة تعتمد على التمثيل الجزيئي7. يمكن التعامل مع هذا المسعى باستخدام مجموعة متنوعة من الواصفات الجزيئية وتقنيات تصور البيانات. في المقابل ، فإن التقنيات الأكثر استخداما هي تحليل المكونات الرئيسية (PCA) ، وأشجار السقالات ، والخرائط ذاتية التنظيم ، ورسم الخرائط الطبوغرافية التوليدية (GTM) ، وتقنية تصور جديدة تسمى خرائط الشجرة (TMAPs)8. أيضا ، يعد جمع وتقييم ونشر المعلومات الكيميائية ل NP في قواعد البيانات المركبة أحد استخدامات المعلوماتية الكيميائية في أبحاث NP. في المقابل ، مع إدخال البيانات الضخمة ، هذا وثيق الصلةبشكل خاص 9.

هنا ، يتم استخدام قواعد بيانات NP مفتوحة المصدر BIOFACQUIM10 و PeruNPDB11 لوصف البروتوكول الذي يبحث عن تصور وتوصيف الفضاء الكيميائي لمجموعات بيانات المركبات الطبيعية باستخدام تمثيلات جزيئية مختلفة ، وينشئ تمثيلات مرئية لمثل هذه المساحات ويحقق في علاقات البنية والخاصية داخل المساحات الكيميائية ، مع التركيز على تطبيقات اكتشاف الأدوية.

Protocol

1. تنزيل البرامج وتثبيتها

  1. اجعل دليل هذا المشروع جديدا. للوصول المريح ، ضع الملفات التنفيذية والملفات في هذا الدليل.
  2. قم بتثبيت حزم البرامج المطلوبة بعد تنزيلها.
  3. قم بتنزيل أحدث إصدار من برنامج Osiris DataWarrior (OSIRIS) ، والذي يمكن العثور عليه على https://openmolecules.org/datawarrior/
  4. قم بتنزيل أحدث إصدار من منصة تحليلات Konstanz Information Miner (KNIME) ، والتي يمكن العثور عليها على https://www.knime.com/
  5. قم بتنزيل أحدث إصدار من برنامج GraphPad Prism ، والذي يمكن العثور عليه على https://www.graphpad.com/
    ملاحظة: يمكن استخدام برنامج Osiris DataWarrior ومنصة تحليلات Konstanz Information Miner (KNIME) على جهاز كمبيوتر شخصي وهي مجانية للاستخدام الفردي ، بينما يمكن شراء برنامج GraphPad Prism من (https://www.graphpad.com/).

2. بناء وتنظيم قاعدة بيانات مركبة

ملاحظة: ابحث عن المواد والمصادر التي تحتوي على البيانات اللازمة. ينصح المستخدم بالحصول على التفاصيل التالية لكل مركب في جدول بيانات.

  1. قم بتسمية كل مركب. أضف أسماء جميع المركبات الموضحة في المصدر في العمود الأول من جدول البيانات.
  2. قم بتعيين رمز داخلي وموحد في حالة إنشاء مجموعة داخلية ، أو قم بتعيين رقم يحدد هذا المركب بشكل فريد في قاعدة البيانات التي تمت استشارتها.
  3. قم بتوفير مدخلات الهيكل باستخدام تدوين SMILES الأساسي، والذي يمكن استيراده إلى أدوات التحرير الجزيئي الأخرى.
    1. احفظ قاعدة البيانات بشكل مثالي بتنسيق .csv بمجرد جمع هذه البيانات في جدول البيانات.
    2. استخدم برنامج OSIRIS لإنشاء ملفات بيانات هيكل مجموعة البيانات (SDF) وملف البيانات الجزيئية (mol) و mol2 ، والتي تحتوي أيضا على معلومات كيميائية وقابلة للتشغيل البيني مع معظم حزم البرامج. لهذا ، قم بتحميل أرشيف .csv بالنقر فوق ملف زر ثم افتح زر.
    3. قم بتحميل مجموعة البيانات إلى منصة تحليلات KNIME لتحسين جودة البيانات ومنع النتائج غير الدقيقة. لهذا ، قم بتحميل ملف .sdf أو .mol2 بالنقر فوق ملف زر ثم فتح زر.
  4. ضمان التوحيد في الهياكل الكيميائية.
    1. افحص كل تركيب كيميائي بحثا عن أنواع الذرات الصالحة وفحوصات التكافؤ. قم بتوحيد الهياكل عن طريق تحويلها إلى شكل توتوميري قانوني ، وكيكول الهياكل العطرية ، وتوحيد موضع روابط الاستريو ، وتحويل جميع الهيدروجينات الضمنية إلى هيدروجينات صريحة باستخدام سير عمل الهياكل الجزيئية الموحدة ل KNIME.
    2. ابحث عن التكرارات وتخلص منها بعد توحيد الجزيئات بشكل صحيح من خلال استخدام سير عمل الهياكل الجزيئية الموحدة ل KNIME. استخدم مفاتيح InChI كتدوين خطي لتحديد حالات البروتونات المختلفة والتوتيمترات.
    3. القضاء على التكرارات.
    4. تعداد التوتومرات والأيزومرات الفراغية. هذه الخطوة ضرورية في دراسات الفحص الافتراضي ، خاصة عند استخدام طرق البحث مثل الإرساء أو التصفية القائمة على الأدوية.

3. الواصفات الجزيئية وتحليل التنوع

ملاحظة: الواصفات الجزيئية ، مثل الصفات الفيزيائية والكيميائية ، والبصمات الجزيئية والسقالات الكيميائية ، هي الأساليب الأكثر شيوعا لتمثيل الجزيئات في تطبيقات المعلوماتية الكيميائية. يمكن إجراء التحليل هنا: http://132.248.103.152:3838/PUMA/. جميع الخطوات الموضحة أدناه مفصلة على موقع PUMA الإلكتروني.

  1. احسب الصفات الفيزيائية والكيميائية الست الأكثر انتشارا ذات الأهمية الدوائية: الوزن الجزيئي (MW) ، ومعامل تقسيم الأوكتانول / الماء (clogP) ، ومساحة السطح الطوبولوجية (TPSA) ، والذوبان المائي (clogS) ، وعدد الذرات المانحة للرابطة H (HBD) ، وعدد ذرات متقبل الرابطة H (HBA). يرجى الرجوع إلى موقع PUMA الإلكتروني للحصول على مزيد من المعلومات.
  2. احسب مفاتيح MACCS 166 بت ، وتشابه Tanimoto الزوجي ، وبصمات الاتصال الموسعة للقطر 4 (ECFP4) ، جنبا إلى جنب مع بصمات الأصابع الدائرية الأخرى المناسبة للفحص الافتراضي ، ونمذجة مشهد النشاط ، وأبحاث العلاقات بين الهيكل والنشاط (SAR).
  3. احسب إحصائية الاتجاه المركزي لكل مقارنة زوجية. ضمان التنوع في مجموعة البيانات بمتوسط أو متوسط أصغر يتعارض مع المسافة الإقليدية أو أي مقياس مسافة عام.
  4. تحقق مما إذا كانت القيم المحسوبة قد تم تسجيلها في الأدبيات أو تم حسابها لقواعد بيانات مرجعية أخرى لأغراض المقارنة. لهذا ، استشر مواقع الويب مثل PubChem أو CHEMBL.
  5. قم بإنشاء مخططات كمان للتصور داخل برنامج GraphPad Prism ، مع عرض القيم القصوى والصغرى.

4. تصور الفضاء الكيميائي

ملاحظة: من الممكن تكثيف غالبية البيانات ذات الصلة في عدد صغير من المتغيرات باستخدام PCA وتقنيات تقليل الأبعاد الأخرى. لذلك أصبحت تصورات الفضاء الكيميائي ممكنة.

  1. حدد جميع الواصفات الستة لتحديد التشابه أو المسافة. قم بإنشاء مصفوفة التشابه (أو المسافة) وفقا لذلك.
  2. قم بإجراء تحليل PCA على المصفوفة. حدد مكونين أو ثلاثة مكونات رئيسية للتخطيط. ضع في اعتبارك نسبة التباين التي تم التقاطها بواسطة كل مكون أساسي.
  3. قم بإنشاء تمثيلات مخططات مبعثرة ثنائية أو ثلاثية الأبعاد ل PCA باستخدام عقدة Plotly KNIME.

5. مؤامرات تنوع الإجماع

ملاحظة: تم تطوير التمثيلات المرئية لتلخيص بعض الخصائص التي يمكن استخدامها لتحديد التنوع. يمكن إجراء تحليل مخططات التنوع الإجماعي (CDPs)12 هنا http://132.248.103.152:3838/CDPlots/.

  1. قم بإنشاء مخطط بعدد المركبات في قاعدة البيانات لتحديد حجم نقطة البيانات. استخدم تنوع البصمات الجزيئية للمحور x ، وتنوع السقالات للمحور y ، والتنوع بناء على الخصائص الفيزيائية والكيميائية لمقياس اللون المستمر ، والعدد النسبي للمركبات في مجموعة البيانات لحجم نقطة البيانات.
  2. قم بإنشاء المخطط متعدد المتغيرات باستخدام برنامج GraphPad Prism.

النتائج

الخصائص الجزيئية وتصور الفضاء الكيميائي
تحتوي جميع المركبات في مجموعات بيانات BIOFACQUIM10 و PeruNPDB11 و FDA13 على ست خصائص فيزيائية وكيميائية محسوبة لها. ثم تم رسم هذه الصفات على مخططات الكمان ، والتي تسمح للمرء برؤية كيفية توزيع خ...

Discussion

نظرا لاستخداماته المحتملة العديدة ، مثل تصنيف المركبات ، واختيار المركب ، واستكشاف روابط الهيكل والنشاط ، والتنقل عبر تفاعلات الهيكل والخاصية ، فإن مفهوم الفضاء الكيميائي يستخدم في الوقت الحاضر على نطاق واسع في عملية اكتشاف الأدويةوتطويرها 14. أيضا ، يعد إ?...

Disclosures

ويعلن أصحاب البلاغ أنه ليس لديهم أي تضارب في المصالح.

Acknowledgements

تشكر HLBC و MACH تمويل Universidad Catolica de Santa Maria (المنح 27499-R-2020 و 27574-R-2020 و 7309-CU-2020 و 28048-R-2021). تشكر JLMF تمويل DGAPA و UNAM و Programa de Apoyo a Proyectos de Investigación e Innovación Tecnológica (PAPIIT) ، المنحة No. IN201321.

Materials

NameCompanyCatalog NumberComments
GraphPad PrismGraphPad Prismhttps://www.graphpad.com/
KNIME platformKNIMEhttps://www.knime.com
Osiris DataWarrior (OSIRIS) softwareopenmolecules.orghttps://openmolecules.org/datawarrior/
PUMAPUMA: Platform for Unified Molecular Analysishttp://132.248.103.152:3838/PUMA/

References

  1. Boufridi, A., Quinn, R. J. Harnessing the properties of natural products. Annu Rev Pharmacol Toxicol. 58, 451-470 (2018).
  2. Gómez-García, A., et al. Navigating the chemical space and chemical multiverse of a unified Latin American natural product database: LANaPDB. ChemRxiv. , (2023).
  3. Newman, D. J., Cragg, G. M. Natural products as sources of new drugs over the nearly four decades from 01/1981 to 09/2019. J Nat Prod. 83 (3), 770-803 (2020).
  4. Atanasov, A. G., Zotchev, S. B., Dirsch, V. M., Supuran, C. T. Natural products in drug discovery: advances and opportunities. Nat Rev Drug Discov. 20 (3), 200-216 (2021).
  5. Medina-Franco, J. L., Saldívar-González, F. I. Cheminformatics to characterize pharmacologically active natural products. Biomolecules. 10 (11), 1566 (2020).
  6. Chen, Y., Garcia De Lomana, M., Friedrich, N. O., Kirchmair, J. Characterization of the Chemical Space of Known and Readily Obtainable Natural Products. J Chem Inf Model. 58 (8), 1518-1532 (2018).
  7. Gaytán-Hernández, D., Chávez-Hernández, A. L., López-López, E., Miranda-Salas, J., Saldívar-González, F. I., Medina-Franco, J. L. Art driven by visual representations of chemical space. ChemRxiv. , (2023).
  8. Zabolotna, Y., Ertl, P., Horvath, D., Bonachera, F., Marcou, G., Varnek, A. NP Navigator: A new look at the natural product chemical space. Mol Inform. 40 (9), e2100068 (2021).
  9. Martinez-Mayorga, K., Madariaga-Mazon, A., Medina-Franco, J. L., Maggiora, G. The impact of chemoinformatics on drug discovery in the pharmaceutical industry. Expert Opin Drug Discov. 15 (3), 293-306 (2020).
  10. Pilón-Jiménez, B., Saldívar-González, F., Díaz-Eufracio, B., Medina-Franco, J. BIOFACQUIM: A Mexican compound database of natural products. Biomolecules. 9 (1), 31 (2019).
  11. Barazorda-Ccahuana, H. L., et al. PeruNPDB: the Peruvian natural products database for in silico drug screening. Sci Rep. 13 (1), 7577 (2023).
  12. González-Medina, M., Prieto-Martínez, F. D., Owen, J. R., Medina-Franco, J. L. Consensus diversity plots: a global diversity analysis of chemical libraries. J Cheminform. 8, 63 (2016).
  13. Irwin, J. J., et al. ZINC20-A free ultralarge-scale chemical database for ligand discovery. J Chem Inf Model. 60 (12), 6065-6073 (2020).
  14. Naveja, J. J., Medina-Franco, J. L. Finding constellations in chemical space through core analysis. Front Chem. 7, 510 (2019).
  15. Cavasotto, C. N., Di Filippo, J. I. Artificial intelligence in the early stages of drug discovery. Arch Biochem Biophys. 698, 108730 (2021).
  16. Rosén, J., Gottfries, J., Muresan, S., Backlund, A., Oprea, T. I. Novel chemical space exploration via natural products. J Med Chem. 52 (7), 1953-1962 (2009).
  17. Sliwoski, G., Kothiwale, S., Meiler, J., Lowe Jr, E. W. Computational methods in drug discovery. Pharmacol Rev. 66 (1), 334-395 (2014).
  18. Goyzueta-Mamani, L. D., Barazorda-Ccahuana, H. L., Mena-Ulecia, K., Chávez-Fumagalli, M. A. Antiviral activity of metabolites from Peruvian plants against SARS-CoV-2: An in silico approach. Molecules. 26 (13), 3882 (2021).
  19. Goyzueta-Mamani, L. D., et al. In silico analysis of metabolites from Peruvian native plants as potential therapeutics against Alzheimer's disease. Molecules. 27 (3), 918 (2022).
  20. Barazorda-Ccahuana, H. L., et al. Computer-aided drug design approaches applied to screen natural product's structural analogs targeting arginase in Leishmania spp. F1000Research. 12, 93 (2023).
  21. McGrady, M. Y., Colby, S. M., Nuñez, J. R., Renslow, R. S., Metz, T. O. AI for chemical space gap filling and novel compound generation. arXiv. , (2022).
  22. Medina-Franco, J., Martinez-Mayorga, K., Giulianotti, M., Houghten, R., Pinilla, C. Visualization of the chemical space in drug discovery. Curr Comput Aided-Drug Des. 4 (4), 322-333 (2008).
  23. Osolodkin, D. I., Radchenko, E. V., Orlov, A. A., Voronkov, A. E., Palyulin, V. A., Zefirov, N. S. Progress in visual representations of chemical space. Expert Opin Drug Discov. 10 (9), 959-973 (2015).
  24. Sheridan, R. P., Kearsley, S. K. Why do we need so many chemical similarity search methods. Drug Discov Today. 7 (17), 903-911 (2002).
  25. Singh, N., Guha, R., Giulianotti, M. A., Pinilla, C., Houghten, R. A., Medina-Franco, J. L. Chemoinformatic analysis of combinatorial libraries, drugs, natural products, and molecular libraries Small Molecule Repository. J Chem Inf Model. 49 (4), 1010-1024 (2009).
  26. Medina-Franco, J. L., Chávez-Hernández, A. L., López-López, E., Saldívar-González, F. I. Chemical multiverse: An expanded view of chemical space. Mol Inform. 41 (11), e2200116 (2022).

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Explore More Articles

ADME BIOFACQUIM PeruNPDB

This article has been published

Video Coming Soon

JoVE Logo

Privacy

Terms of Use

Policies

Research

Education

ABOUT JoVE

Copyright © 2025 MyJoVE Corporation. All rights reserved