需要订阅 JoVE 才能查看此. 登录或开始免费试用。
Method Article
在这里,我们提供了一种方法,使用不同的分子表示来显示和分析天然化合物数据集的化学空间,重点是与药物发现相关的应用。
化学空间是一个多维描述空间,它包含所有可能的分子,并且至少有 1 x 1060 种分子量低于 500 Da 的有机物质被认为可能与药物发现相关。天然产物一直是过去 40 年中上市的新药理学实体的主要来源,并继续成为创造创新药物的最有效来源之一。基于化学信息学的计算工具可加速天然产物的药物开发过程。已经使用了包括估计生物活性、安全性概况、ADME 和天然产物相似性测量在内的方法。在这里,我们回顾了化学信息学工具的最新发展,这些工具旨在使用各种分子表示来可视化、表征和扩展天然化合物数据集的化学空间,创建此类空间的可视化表示,并研究化学空间内的结构-性质关系。我们以药物发现应用为重点,评估了开源数据库 BIOFACQUIM 和 PeruNPDB 作为概念验证。
天然产物 (NP) 是由生物产生的化合物,几个世纪以来一直被用作传统治疗方法。单个 NP 在现代已被创造为药物,并成功作为药物发现中的先导化合物开发1。人类和动物产生的海洋、真菌、细菌、植物和内源性物质都属于生物活性化合物的范畴,各种动物产生的毒液和毒药也属于生物活性化合物的范畴2。因此,四十年来,NP 制造的药物数量代表了新药理学物质的重要来源3,强调 NP 在新药的开发中至关重要,特别是用于治疗癌症和传染病,以及多发性硬化症和心血管疾病等其他治疗病症4.此外,在 1981 年至 2019 年间被授权用于治疗癌症的 185 种小化合物中,有 64.9% 是未修饰的 NP 或具有 NP 药效团的合成药物3。
化学信息学是一门建立在化学空间概念之上的成熟跨学科,已被用于分析和可视化与药物样特征相关的 NP 物理化学性质的化学空间5。化学信息学已显示出对基于 NPs6 的药物设计和发现的重大影响。一组化合物的化学空间并不总是唯一的。这将取决于用于定义它的描述符集合,这意味着研究 NP 的化学空间与任何其他化合物组一样,提出了依赖于分子表示7 的特殊挑战。可以使用各种分子描述符和数据可视化技术来实现这项工作。相比之下,最常用的技术是主成分分析 (PCA)、基架树、自组织映射、生成地形映射 (GTM) 和一种称为树状图 (TMAP) 的新型可视化技术8。此外,在化合物数据库中收集、评估和传播 NP 的化学信息是化学信息学在 NP 研究中的用途之一。相比之下,随着大数据的引入,这一点尤其相关9。
在这里,开源 NP 数据库 BIOFACQUIM10 和 PeruNPDB11 用于描述使用各种分子表示搜索天然化合物数据集化学空间的可视化和表征的协议,创建此类空间的可视化表示并研究化学空间内的结构-性质关系,重点是药物发现应用。
Access restricted. Please log in or start a trial to view this content.
1. 软件下载安装
2. 化合物数据库的构建和管理
注意:查找具有必要数据的物质和来源。建议用户在电子表格中为每个化合物提供以下详细信息。
3. 分子描述符和多样性分析
注:分子描述符,如物理化学性质、分子指纹图谱和化学支架,是化学信息学应用中表示分子的最常用方法。分析可在此处执行:http://132.248.103.152:3838/PUMA/。下面描述的所有步骤都在 PUMA 网站上进行了详细说明。
4. 化学空间的可视化
注意:可以使用 PCA 和其他降维技术将大部分相关数据压缩为少量变量。因此,化学空间的可视化成为可能。
5. 一致性多样性图
注意:已经开发了视觉表示来总结一些可用于量化多样性的特征。共有多样性图 (CDPs)12 分析可以在此处进行 http://132.248.103.152:3838/CDPlots/。
Access restricted. Please log in or start a trial to view this content.
分子性质和化学空间的可视化
BIOFACQUIM10、PeruNPDB11 和 FDA13 数据集中的所有化合物都计算了 6 种理化性质。然后将这些品质绘制到小提琴图上,这样人们可以看到三个研究数据集的属性是如何分布的(图 1)。药物感兴趣的六个物理化学参数的分布曲线,即分子量 (MW)、辛醇/水分...
Access restricted. Please log in or start a trial to view this content.
由于其许多潜在用途,例如化合物分类、化合物选择、探索结构-活性联系以及通过结构-性能相互作用进行导航,化学空间的概念如今被广泛用于药物发现和开发过程14。此外,由于 Chemical Information 量的增加,NP 数据库的创建 NP 数据库是执行各种计算研究的基本程序,包括化学库的设计、化学空间的表征和比较、SAR 的研究和虚拟筛选等研究。相比之下?...
Access restricted. Please log in or start a trial to view this content.
作者声明他们没有任何利益冲突。
HLBC 和 MACH 感谢圣玛丽亚天主教大学的资助(赠款 27499-R-2020、27574-R-2020、7309-CU-2020 和 28048-R-2021)。JLMF 感谢 DGAPA、UNAM、Programa de Apoyo a Proyectos de Investigación e Innovación Tecnológica (PAPIIT) 的资助,授予号。IN201321。
Access restricted. Please log in or start a trial to view this content.
Name | Company | Catalog Number | Comments |
GraphPad Prism | GraphPad Prism | https://www.graphpad.com/ | |
KNIME platform | KNIME | https://www.knime.com | |
Osiris DataWarrior (OSIRIS) software | openmolecules.org | https://openmolecules.org/datawarrior/ | |
PUMA | PUMA: Platform for Unified Molecular Analysis | http://132.248.103.152:3838/PUMA/ |
Access restricted. Please log in or start a trial to view this content.
请求许可使用此 JoVE 文章的文本或图形
请求许可This article has been published
Video Coming Soon
版权所属 © 2025 MyJoVE 公司版权所有,本公司不涉及任何医疗业务和医疗服务。