JoVE Logo

Войдите в систему

Для просмотра этого контента требуется подписка на Jove Войдите в систему или начните бесплатную пробную версию.

В этой статье

  • Резюме
  • Аннотация
  • Введение
  • протокол
  • Результаты
  • Обсуждение
  • Раскрытие информации
  • Благодарности
  • Материалы
  • Ссылки
  • Перепечатки и разрешения

Резюме

В этой статье мы предлагаем методологию, которая использует различные молекулярные представления для отображения и анализа химического пространства наборов данных о природных соединениях, уделяя особое внимание приложениям, связанным с открытием лекарств.

Аннотация

Химическое пространство — это многомерное пространство дескрипторов, которое заключает в себе все возможные молекулы, и по крайней мере 1 x 1060 органических веществ с молекулярной массой ниже 500 Да считаются потенциально релевантными для открытия лекарств. Натуральные продукты были основным источником новых фармакологических препаратов на рынке в течение последних сорока лет и продолжают оставаться одним из самых продуктивных источников для создания инновационных лекарственных препаратов. Вычислительные инструменты на основе хемоинформатики ускоряют процесс разработки лекарств для натуральных продуктов. Были использованы методы, включающие оценку биологической активности, профилей безопасности, ADME и измерение сходства натурального продукта. В этой статье мы рассмотрим последние разработки в области хемоинформатических инструментов, предназначенных для визуализации, характеристики и расширения химического пространства наборов данных о природных соединениях с использованием различных молекулярных представлений, создания визуальных представлений таких пространств и исследования отношений структура-свойства в химических пространствах. Уделяя особое внимание приложениям для разработки лекарств, мы оцениваем базы данных с открытым исходным кодом BIOFACQUIM и PeruNPDB как доказательство концепции.

Введение

Натуральные продукты (НЧ), которые представляют собой химические соединения, созданные живыми существами, использовались в качестве традиционных методов лечения на протяжении веков. Отдельные НЧ были созданы в качестве лекарств в современную эпоху и успешно используются в качестве соединений свинца при открытии лекарств1. В категорию биологически активных соединений входят морские, грибковые, бактериальные, растительные и эндогенные вещества, созданные человеком и животными, а также яды и яды, вырабатываемые различными животными2. В результате, в течение сорока лет количество лекарств, производимых НЧ, представляло собой значительный источник новых фармакологическихвеществ3, подчеркивая, что НЧ сыграли решающую роль в разработке новых лекарств, особенно для лечения рака и инфекционных заболеваний, а также других терапевтических состояний, таких как рассеянный склероз и сердечно-сосудистыезаболевания.. Кроме того, 64,9% из 185 малых соединений, которые были разрешены для лечения рака в период с 1981 по 2019 год, были немодифицированными НЧ или синтетическими лекарственными средствами с фармакофоромНЧ3.

Хемоинформатика, хорошо зарекомендовавшая себя междисциплинарная дисциплина, основанная на концепции химического пространства, была использована для анализа и визуализации химического пространства физико-химических качеств НП, связанных с лекарственнымисвойствами. Хемоинформатика показала существенное влияние на разработку и открытие лекарств на основе НЧ6. Химическое пространство группы соединений не всегда уникально. Это будет зависеть от набора дескрипторов, используемых для его определения, а это означает, что изучение химического пространства НЧ, как и любого другого набора соединений, сопряжено с особыми проблемами, которые основываются на молекулярном представлении. К этой задаче можно подойти с помощью различных молекулярных дескрипторов и методов визуализации данных. В отличие от этого, наиболее часто используемыми методами являются анализ главных компонент (PCA), каркасные деревья, самоорганизующиеся карты, генеративное топографическое картографирование (GTM) и новый метод визуализации, называемый древовидными картами (TMAP)8. Кроме того, сбор, оценка и распространение химической информации о НЧ в базах данных соединений является одним из видов использования хемоинформатики в исследованиях НЧ. В отличие от этого, с внедрением больших данных это особенно актуально9.

Здесь базы данных NP с открытым исходным кодом BIOFACQUIM10 и PeruNPDB11 используются для описания протокола, который ищет визуализацию и характеристику химического пространства наборов данных о природных соединениях с использованием различных молекулярных представлений, создает визуальные представления таких пространств и исследует отношения структура-свойства в химических пространствах, уделяя особое внимание приложениям для разработки лекарств.

протокол

1. Загрузка и установка программного обеспечения

  1. Сделайте каталог этого проекта свежим. Для удобного доступа поместите исполняемые файлы и файлы в эту директорию.
  2. Установите необходимые программные пакеты после их загрузки.
  3. Загрузите последнюю версию программного обеспечения Osiris DataWarrior (OSIRIS), которую можно найти на https://openmolecules.org/datawarrior/
  4. Загрузите последнюю версию аналитической платформы Konstanz Information Miner (KNIME), которую можно найти по адресу https://www.knime.com/
  5. Загрузите последнюю версию программного обеспечения The GraphPad Prism, которую можно найти на https://www.graphpad.com/
    ПРИМЕЧАНИЕ: Программное обеспечение Osiris DataWarrior и аналитическая платформа Konstanz Information Miner (KNIME) могут использоваться на персональном компьютере и бесплатны для индивидуального использования, в то время как программное обеспечение GraphPad Prism можно приобрести по адресу (https://www.graphpad.com/).

2. Построение и курирование составной базы данных

ПРИМЕЧАНИЕ: Найдите вещества и источники, которые имеют необходимые данные. Пользователю рекомендуется иметь следующие сведения о каждом соединении в электронной таблице.

  1. Назовите каждое соединение. Добавьте названия всех соединений, описанных в источнике, в первый столбец таблицы.
  2. Назначьте внутренний, стандартизированный код при создании внутренней коллекции или назначьте номер, который однозначно идентифицирует это соединение в используемой базе данных.
  3. Предоставьте входные данные структуры с помощью канонической нотации SMILES, которую можно импортировать в другие инструменты молекулярного редактирования.
    1. В идеале сохраните базу данных в .csv формате после того, как эти данные будут собраны в электронной таблице.
    2. Используйте программное обеспечение OSIRIS для создания файлов структурных данных (SDF), молекулярных данных (mol) и mol2 набора данных, которые также содержат химическую информацию и совместимы с большинством программных пакетов. Для этого загрузите архив .csv , нажав кнопку «Файл», а затем кнопку «Открыть ».
    3. Загрузите набор данных на аналитическую платформу KNIME, чтобы улучшить качество данных и предотвратить неточные результаты. Для этого загрузите файл .sdf или .mol2 , нажав кнопку «Файл», а затем кнопку «Открыть ».
  4. Обеспечивают однородность химических структур.
    1. Исследуйте каждую химическую структуру на предмет допустимых типов атомов и проверки валентности. Стандартизируйте структуры, преобразовав их в каноническую таутомерную форму, кекулизируя ароматические структуры, стандартизировав расположение стереосвязей и превратив все неявные водороды в явные с помощью рабочего процесса « Стандартизация молекулярных структур » KNIME.
    2. Находите и устраняйте дубликаты после правильной стандартизации молекул с помощью рабочего процесса «Стандартизация молекулярных структур» KNIME. Используйте ключи InChI в качестве линейной нотации для определения различных состояний протонации и таутомеров.
    3. Устраните дубликаты.
    4. Перечислите таутомеры и стереоизомеры. Этот шаг имеет решающее значение в виртуальных скрининговых исследованиях, особенно при использовании таких методов поиска, как докинг или фармакофорная фильтрация.

3. Молекулярные дескрипторы и анализ разнообразия

Примечание: Молекулярные дескрипторы, такие как физико-химические качества, молекулярные отпечатки пальцев и химические каркасы, являются наиболее распространенными подходами к представлению молекул в хемоинформатических приложениях. Анализ можно провести здесь: http://132.248.103.152:3838/PUMA/. Все описанные ниже шаги подробно описаны на сайте PUMA.

  1. Рассчитайте шесть наиболее распространенных физико-химических качеств фармакологической значимости: молекулярная масса (MW), коэффициент разделения октанол/вода (clogP), топологическая площадь поверхности (TPSA), растворимость в воде (clogS), количество донорных атомов H-связи (HBD) и количество акцепторных атомов H-связи (HBA). Для получения дополнительной информации посетите веб-сайт PUMA.
  2. Вычислите 166-битные ключи MACCS, попарное сходство по Танимото и отпечатки расширенной связности диаметра 4 (ECFP4), а также другие круглые отпечатки, подходящие для виртуального скрининга, моделирования ландшафта деятельности и исследования отношений структура-активность (SAR).
  3. Вычислите центральную статистику тенденций для каждого попарного сравнения. Обеспечьте разнообразие в наборе данных с меньшим средним или медианой, противоречащим евклидову дистанции или любой общей метрике расстояния.
  4. Проверьте, были ли рассчитанные значения зафиксированы в литературе или рассчитаны для других справочных баз данных для сравнения. Для этого обратитесь к таким веб-сайтам, как PubChem или CHEMBL.
  5. Создавайте графики скрипки для визуализации в программном обеспечении GraphPad Prism, отображая максимальные и минимальные значения.

4. Визуализация химического пространства

ПРИМЕЧАНИЕ: Можно сжать большую часть релевантных данных в небольшое число переменных с помощью PCA и других методов уменьшения размерности. Таким образом, становится возможной визуализация химического пространства.

  1. Выберите все шесть дескрипторов, чтобы определить сходство или расстояние. Соответственно создайте матрицу подобия (или расстояния).
  2. Выполнение PCA-анализа матрицы. Выберите два или три основных компонента для построения графика. Учитывайте долю дисперсии, охватываемую каждым основным компонентом.
  3. Создание двухмерных или трехмерных точечных представлений для PCA с помощью узла Plotly KNIME.

5. Согласованные графики с разнесением

ПРИМЕЧАНИЕ: Визуальные представления были разработаны для обобщения нескольких характеристик, которые могут быть использованы для количественной оценки разнообразия. Здесь http://132.248.103.152:3838/CDPlots/ можно провести анализ графиков консенсусного разнесения (CDP)12 .

  1. Создайте график с количеством соединений в базе данных, чтобы определить размер точки данных. Используйте разнообразие молекулярных отпечатков пальцев для оси x, разнообразие скаффолдов для оси y, разнообразие на основе физико-химических свойств для непрерывной шкалы цвета и относительное количество соединений в наборе данных для размера точки данных.
  2. Сгенерируйте график с несколькими переменными с помощью программного обеспечения GraphPad Prism.

Результаты

Молекулярные свойства и визуализация химического пространства
Все соединения в наборах данных BIOFACQUIM10, PeruNPDB11 и FDA13 имели шесть рассчитанных физико-химических свойств. Затем эти качества были нанесены на графики скрип?...

Обсуждение

Благодаря своим многочисленным потенциальным применениям, таким как классификация соединений, выбор соединений, изучение связей структура-активность и навигация по взаимодействию структуры и свойства, концепция химического пространства в настоящее время широко и?...

Раскрытие информации

Авторы заявляют, что у них нет никакого конфликта интересов.

Благодарности

HLBC и MACH благодарят за финансирование Католический университет Санта-Мария (гранты 27499-R-2020, 27574-R-2020, 7309-CU-2020 и 28048-R-2021). JLMF благодарит за финансирование DGAPA, UNAM, Programa de Apoyo a Proyectos de Investigación e Innovación Tecnológica (PAPIIT), grant No. IN201321.

Материалы

NameCompanyCatalog NumberComments
GraphPad PrismGraphPad Prismhttps://www.graphpad.com/
KNIME platformKNIMEhttps://www.knime.com
Osiris DataWarrior (OSIRIS) softwareopenmolecules.orghttps://openmolecules.org/datawarrior/
PUMAPUMA: Platform for Unified Molecular Analysishttp://132.248.103.152:3838/PUMA/

Ссылки

  1. Boufridi, A., Quinn, R. J. Harnessing the properties of natural products. Annu Rev Pharmacol Toxicol. 58, 451-470 (2018).
  2. Gómez-García, A., et al. Navigating the chemical space and chemical multiverse of a unified Latin American natural product database: LANaPDB. ChemRxiv. , (2023).
  3. Newman, D. J., Cragg, G. M. Natural products as sources of new drugs over the nearly four decades from 01/1981 to 09/2019. J Nat Prod. 83 (3), 770-803 (2020).
  4. Atanasov, A. G., Zotchev, S. B., Dirsch, V. M., Supuran, C. T. Natural products in drug discovery: advances and opportunities. Nat Rev Drug Discov. 20 (3), 200-216 (2021).
  5. Medina-Franco, J. L., Saldívar-González, F. I. Cheminformatics to characterize pharmacologically active natural products. Biomolecules. 10 (11), 1566 (2020).
  6. Chen, Y., Garcia De Lomana, M., Friedrich, N. O., Kirchmair, J. Characterization of the Chemical Space of Known and Readily Obtainable Natural Products. J Chem Inf Model. 58 (8), 1518-1532 (2018).
  7. Gaytán-Hernández, D., Chávez-Hernández, A. L., López-López, E., Miranda-Salas, J., Saldívar-González, F. I., Medina-Franco, J. L. Art driven by visual representations of chemical space. ChemRxiv. , (2023).
  8. Zabolotna, Y., Ertl, P., Horvath, D., Bonachera, F., Marcou, G., Varnek, A. NP Navigator: A new look at the natural product chemical space. Mol Inform. 40 (9), e2100068 (2021).
  9. Martinez-Mayorga, K., Madariaga-Mazon, A., Medina-Franco, J. L., Maggiora, G. The impact of chemoinformatics on drug discovery in the pharmaceutical industry. Expert Opin Drug Discov. 15 (3), 293-306 (2020).
  10. Pilón-Jiménez, B., Saldívar-González, F., Díaz-Eufracio, B., Medina-Franco, J. BIOFACQUIM: A Mexican compound database of natural products. Biomolecules. 9 (1), 31 (2019).
  11. Barazorda-Ccahuana, H. L., et al. PeruNPDB: the Peruvian natural products database for in silico drug screening. Sci Rep. 13 (1), 7577 (2023).
  12. González-Medina, M., Prieto-Martínez, F. D., Owen, J. R., Medina-Franco, J. L. Consensus diversity plots: a global diversity analysis of chemical libraries. J Cheminform. 8, 63 (2016).
  13. Irwin, J. J., et al. ZINC20-A free ultralarge-scale chemical database for ligand discovery. J Chem Inf Model. 60 (12), 6065-6073 (2020).
  14. Naveja, J. J., Medina-Franco, J. L. Finding constellations in chemical space through core analysis. Front Chem. 7, 510 (2019).
  15. Cavasotto, C. N., Di Filippo, J. I. Artificial intelligence in the early stages of drug discovery. Arch Biochem Biophys. 698, 108730 (2021).
  16. Rosén, J., Gottfries, J., Muresan, S., Backlund, A., Oprea, T. I. Novel chemical space exploration via natural products. J Med Chem. 52 (7), 1953-1962 (2009).
  17. Sliwoski, G., Kothiwale, S., Meiler, J., Lowe Jr, E. W. Computational methods in drug discovery. Pharmacol Rev. 66 (1), 334-395 (2014).
  18. Goyzueta-Mamani, L. D., Barazorda-Ccahuana, H. L., Mena-Ulecia, K., Chávez-Fumagalli, M. A. Antiviral activity of metabolites from Peruvian plants against SARS-CoV-2: An in silico approach. Molecules. 26 (13), 3882 (2021).
  19. Goyzueta-Mamani, L. D., et al. In silico analysis of metabolites from Peruvian native plants as potential therapeutics against Alzheimer's disease. Molecules. 27 (3), 918 (2022).
  20. Barazorda-Ccahuana, H. L., et al. Computer-aided drug design approaches applied to screen natural product's structural analogs targeting arginase in Leishmania spp. F1000Research. 12, 93 (2023).
  21. McGrady, M. Y., Colby, S. M., Nuñez, J. R., Renslow, R. S., Metz, T. O. AI for chemical space gap filling and novel compound generation. arXiv. , (2022).
  22. Medina-Franco, J., Martinez-Mayorga, K., Giulianotti, M., Houghten, R., Pinilla, C. Visualization of the chemical space in drug discovery. Curr Comput Aided-Drug Des. 4 (4), 322-333 (2008).
  23. Osolodkin, D. I., Radchenko, E. V., Orlov, A. A., Voronkov, A. E., Palyulin, V. A., Zefirov, N. S. Progress in visual representations of chemical space. Expert Opin Drug Discov. 10 (9), 959-973 (2015).
  24. Sheridan, R. P., Kearsley, S. K. Why do we need so many chemical similarity search methods. Drug Discov Today. 7 (17), 903-911 (2002).
  25. Singh, N., Guha, R., Giulianotti, M. A., Pinilla, C., Houghten, R. A., Medina-Franco, J. L. Chemoinformatic analysis of combinatorial libraries, drugs, natural products, and molecular libraries Small Molecule Repository. J Chem Inf Model. 49 (4), 1010-1024 (2009).
  26. Medina-Franco, J. L., Chávez-Hernández, A. L., López-López, E., Saldívar-González, F. I. Chemical multiverse: An expanded view of chemical space. Mol Inform. 41 (11), e2200116 (2022).

Перепечатки и разрешения

Запросить разрешение на использование текста или рисунков этого JoVE статьи

Запросить разрешение

Смотреть дополнительные статьи

ADMEBIOFACQUIMPeruNPDB

This article has been published

Video Coming Soon

JoVE Logo

Исследования

Образование

О JoVE

Авторские права © 2025 MyJoVE Corporation. Все права защищены