JoVE Logo

サインイン

このコンテンツを視聴するには、JoVE 購読が必要です。 サインイン又は無料トライアルを申し込む。

この記事について

  • 要約
  • 要約
  • 概要
  • プロトコル
  • 結果
  • ディスカッション
  • 開示事項
  • 謝辞
  • 資料
  • 参考文献
  • 転載および許可

要約

ここでは、創薬に関連するアプリケーションに焦点を当てて、さまざまな分子表現を使用して天然化合物データセットの化学空間を表示および分析する方法論を提供します。

要約

化学空間は、すべての可能な分子を囲む多次元記述子空間であり、分子量が500Da未満の有機物質が少なくとも1 x 1060 個あれば、創薬に潜在的に関連すると考えられています。天然物は、過去40年間に販売された新しい薬理学的実体の主要な供給源であり、革新的な医薬品の創出のための最も生産的な供給源の1つであり続けています。ケモインフォマティクスベースの計算ツールは、天然物の医薬品開発プロセスを加速します。生物活性の推定、安全性プロファイル、ADME、天然物の類似性測定などの方法が使用されています。ここでは、さまざまな分子表現を使用して天然化合物データセットの化学空間を視覚化、特性評価、および拡張し、そのような空間の視覚的表現を作成し、化学空間内の構造と特性の関係を調査するように設計されたケモインフォマティクスツールの最近の開発について説明します。創薬アプリケーションに重点を置いて、オープンソースデータベースBIOFACQUIMとPeruNPDBを概念実証として評価します。

概要

生物が作り出す化合物である天然物(NP)は、何世紀にもわたって伝統的な治療法として利用されてきました。個々のNPは、現代において医薬品として創製され、創薬のリード化合物として成功裏に利用されています1。人間や動物によって生成される海洋、真菌、細菌、植物、および内因性の物質は、さまざまな動物によって生成される毒物や毒物と同様に、生理活性化合物のカテゴリに含まれます2。その結果、40年間にわたり、NPによって製造された医薬品の数は、新しい薬理学的物質の重要な供給源であり3、NPが特に癌や感染症の治療、および多発性硬化症や心血管疾患などの他の治療状態4の新しい医薬品の開発において重要であることを強調しています.さらに、1981年から2019年の間にがんの治療薬として認可された185の低分子化合物のうち64.9%は、非修飾NPまたはNPファーマコフォア3を持つ合成医薬品でした。

ケモインフォマティクスは、化学空間の概念に基づく確立された学際的研究であり、薬物様特性5に関連するNPの物理化学的性質の化学空間を分析および視覚化するために使用されてきました。ケモインフォマティクスは、NP6に基づく医薬品の設計と発見に大きな影響を与えることが示されています。化合物群の化学空間は、必ずしも一意ではありません。それは、それを定義するために使用される記述子の集合に依存するため、NPの化学空間を他の化合物のセットとして研究することは、分子表現7に依存する特定の課題を提示することを意味します。この取り組みは、さまざまな分子記述子とデータ視覚化技術を使用してアプローチできます。対照的に、最も頻繁に利用される手法は、主成分分析(PCA)、足場ツリー、自己組織化マップ、生成地形マッピング(GTM)、およびツリーマップ(TMAP)8と呼ばれる新しい視覚化技術です。また、NPの化学情報を化合物データベースに収集、評価、および配布することは、NP研究におけるケモインフォマティクスの用途の1つです。対照的に、ビッグデータの導入に伴い、これは特に関連性があります9

ここでは、オープンソースのNPデータベースBIOFACQUIM10 およびPeruNPDB11 を使用して、さまざまな分子表現を使用して天然化合物データセットの化学空間の視覚化と特性評価を検索し、そのような空間の視覚的表現を作成し、創薬アプリケーションに重点を置いて化学空間内の構造と特性の関係を調査するプロトコルについて説明します。

プロトコル

1. ソフトウェアのダウンロードとインストール

  1. このプロジェクトのディレクトリを新しくします。アクセスを容易にするために、実行可能ファイルとファイルをこのディレクトリに置いてください。
  2. 必要なソフトウェアパッケージをダウンロードした後、インストールします。
  3. The Osiris DataWarrior (OSIRIS) ソフトウェアの最新バージョンは、次のURLからダウンロードできます https://openmolecules.org/datawarrior/
  4. The Konstanz Information Miner (KNIME) Analytics Platform の最新バージョンは、次の場所にあります https://www.knime.com/
  5. The GraphPad Prismソフトウェアの最新バージョンをダウンロードしてください https://www.graphpad.com/
    注:Osiris DataWarriorソフトウェアとKonstanz Information Miner(KNIME)Analytics Platformは、パーソナルコンピュータで使用でき、個人使用は無料ですが、GraphPad Prismソフトウェアは(https://www.graphpad.com/)で購入できます。

2. 化合物データベースの構築とキュレーション

注:必要なデータがある物質と供給源を見つけてください。ユーザーは、スプレッドシート内の各化合物について次の詳細を用意することをお勧めします。

  1. 各コンパウンドに名前を付けます。ソースに記載されているすべてのコンパウンドの名前を、スプレッドシートの最初の列に追加します。
  2. 社内コレクションを作成する場合は、内部の標準化されたコードを割り当てるか、参照対象のデータベースでこの化合物を一意に識別する番号を割り当てます。
  3. 標準的なSMILES表記を使用して構造入力を提供し、他の分子編集ツールにインポートできます。
    1. このデータがスプレッドシートに収集されたら.csvデータベースを理想的には形式で保存します。
    2. OSIRISソフトウェアを使用して、データセットの構造データファイル(SDF)、分子データファイル(mol)、およびmol2を生成します。これらは化学情報も含まれており、ほとんどのソフトウェアパッケージと相互運用可能です。これを行うには、 .csv アーカイブをアップロードするには、[ファイル]ボタンをクリックしてから[ 開く ]ボタンをクリックします。
    3. データセットをKNIME分析プラットフォームにアップロードすると、データの品質が向上し、不正確な結果が防止されます。これを行うには、[ファイル]ボタンをクリックしてから[開く]ボタンをクリックして、.sdfまたは.mol2ファイルをアップロードします。
  4. 化学構造の均一性を確保します。
    1. 各化学構造を調べて、有効な原子タイプと原子価チェックを行います。KNIME の Standardizing Molecular Structures ワークフローを使用して、構造を標準的な互変異性体形式に変換し、芳香族構造をケクリ化し、ステレオ結合の位置を標準化し、すべての陰的水素を陽的水素に変換することで、構造を標準化します。
    2. 分子が正しく標準化された後、KNIMEのStandardizing Molecular Structuresワークフローを使用して重複を見つけて排除します。 InChI キーを線形表記として利用し、さまざまなプロトン化状態と互変異性体を特定します。
    3. 重複を排除します。
    4. 互変異性体と立体異性体を列挙します。このステップは、バーチャルスクリーニング研究、特にドッキングやファーマコフォアベースのフィルタリングなどの検索方法を使用する場合に重要です。

3. 分子記述子とダイバーシティ解析

注:物理化学的性質、分子フィンガープリント、化学足場などの分子記述子は、ケモインフォマティクスアプリケーションで分子を表現するための最も一般的なアプローチです。分析はここで実行できます:http://132.248.103.152:3838/PUMA/。以下で説明するすべての手順は、PUMAのWebサイトで詳しく説明されています。

  1. 薬理学的関連性のある最も一般的な6つの物理化学的性質を計算します:分子量(MW)、オクタノール/水分配係数(clogP)、トポロジカル表面積(TPSA)、水溶性(clogS)、H結合ドナー原子の数(HBD)、およびH結合アクセプター原子の数(HBA)。詳細については、PUMAのWebサイトを参照してください。
  2. 166ビットMACCSキー、ペアワイズ谷本類似度、直径4の拡張接続フィンガープリント(ECFP4)、および仮想スクリーニング、アクティビティランドスケープモデリング、および構造活動関係(SAR)研究に適したその他の円形フィンガープリントを計算します。
  3. 各ペアワイズ比較の中心傾向統計量を計算します。データセットの多様性は、ユークリッド距離や一般的な距離メトリックとは対照的に、平均または中央値が小さいことを確認します。
  4. 計算値が文献に記録されているか、比較のために他の参照データベース用に計算されているかを確認します。これについては、PubChemやCHEMBLなどのWebサイトを参照してください。
  5. GraphPad Prismソフトウェア内で視覚化するためのバイオリンプロットを生成し、最大値と最小値を表示します。

4. 化学空間の可視化

注: PCA やその他の次元削減手法を使用して、関連するデータの大部分を少数の変数に凝縮することができます。したがって、化学空間の視覚化が可能になります。

  1. 6 つの記述子をすべて選択して、類似性または距離を判断します。それに応じて、類似度(または距離)行列を作成します。
  2. マトリックスに対してPCA分析を実行します。プロットする主要コンポーネントを 2 つまたは 3 つ選択します。各主成分によって捕捉される分散の比率を考えます。
  3. Plotly KNIME ノードを使用して、PCA の 2 次元または 3 次元の散布図表現を生成します。

5. コンセンサス多様性プロット

注:視覚的表現は、多様性を定量化するために使用できるいくつかの特性を要約するために開発されました。コンセンサスダイバーシティプロット(CDP)12 分析は、ここで http://132.248.103.152:3838/CDPlots/ 実行できます。

  1. データベース内の化合物の数でプロットを作成し、データポイントのサイズを決定します。x 軸には分子フィンガープリントの多様性を、y 軸にはスキャフォールドの多様性を、色連続スケールには物理化学的特性に基づく多様性を、データ ポイント サイズにはデータセット内の化合物の相対数を使用します。
  2. GraphPad Prismソフトウェアを使用して多変数プロットを生成します。

結果

分子物性と化学空間の可視化
BIOFACQUIM10、PeruNPDB11、および FDA13 データセットのすべての化合物は、それらについて計算された 6 つの物理化学的特性を持っていました。次に、これらの特性をバイオリンプロットにプロットし、調査した3つのデータセットのプロパティがどのように分布しているかを...

ディスカッション

化合物の分類、化合物の選択、構造活性リンクの探索、構造と特性の相互作用のナビゲートなど、多くの潜在的な用途があるため、化学空間の概念は、今日、創薬および開発プロセスで広く使用されています14。また、NPデータベースの作成は、化学情報量の増加に伴う化学ライブラリーの設計、化学空間の特性評価と比較、SARの研究、仮想スクリ?...

開示事項

著者は、利益相反がないことを宣言します。

謝辞

HLBCとMACHは、サンタマリア大学カトリカの資金提供に感謝します(助成金27499-R-2020、27574-R-2020、7309-CU-2020、および28048-R-2021)。JLMFは、DGAPA、UNAM、Programa de Apoyo a Proyectos de Investigación e Innovación Tecnológica(PAPIIT)の資金提供に感謝します。IN201321。

資料

NameCompanyCatalog NumberComments
GraphPad PrismGraphPad Prismhttps://www.graphpad.com/
KNIME platformKNIMEhttps://www.knime.com
Osiris DataWarrior (OSIRIS) softwareopenmolecules.orghttps://openmolecules.org/datawarrior/
PUMAPUMA: Platform for Unified Molecular Analysishttp://132.248.103.152:3838/PUMA/

参考文献

  1. Boufridi, A., Quinn, R. J. Harnessing the properties of natural products. Annu Rev Pharmacol Toxicol. 58, 451-470 (2018).
  2. Gómez-García, A., et al. Navigating the chemical space and chemical multiverse of a unified Latin American natural product database: LANaPDB. ChemRxiv. , (2023).
  3. Newman, D. J., Cragg, G. M. Natural products as sources of new drugs over the nearly four decades from 01/1981 to 09/2019. J Nat Prod. 83 (3), 770-803 (2020).
  4. Atanasov, A. G., Zotchev, S. B., Dirsch, V. M., Supuran, C. T. Natural products in drug discovery: advances and opportunities. Nat Rev Drug Discov. 20 (3), 200-216 (2021).
  5. Medina-Franco, J. L., Saldívar-González, F. I. Cheminformatics to characterize pharmacologically active natural products. Biomolecules. 10 (11), 1566 (2020).
  6. Chen, Y., Garcia De Lomana, M., Friedrich, N. O., Kirchmair, J. Characterization of the Chemical Space of Known and Readily Obtainable Natural Products. J Chem Inf Model. 58 (8), 1518-1532 (2018).
  7. Gaytán-Hernández, D., Chávez-Hernández, A. L., López-López, E., Miranda-Salas, J., Saldívar-González, F. I., Medina-Franco, J. L. Art driven by visual representations of chemical space. ChemRxiv. , (2023).
  8. Zabolotna, Y., Ertl, P., Horvath, D., Bonachera, F., Marcou, G., Varnek, A. NP Navigator: A new look at the natural product chemical space. Mol Inform. 40 (9), e2100068 (2021).
  9. Martinez-Mayorga, K., Madariaga-Mazon, A., Medina-Franco, J. L., Maggiora, G. The impact of chemoinformatics on drug discovery in the pharmaceutical industry. Expert Opin Drug Discov. 15 (3), 293-306 (2020).
  10. Pilón-Jiménez, B., Saldívar-González, F., Díaz-Eufracio, B., Medina-Franco, J. BIOFACQUIM: A Mexican compound database of natural products. Biomolecules. 9 (1), 31 (2019).
  11. Barazorda-Ccahuana, H. L., et al. PeruNPDB: the Peruvian natural products database for in silico drug screening. Sci Rep. 13 (1), 7577 (2023).
  12. González-Medina, M., Prieto-Martínez, F. D., Owen, J. R., Medina-Franco, J. L. Consensus diversity plots: a global diversity analysis of chemical libraries. J Cheminform. 8, 63 (2016).
  13. Irwin, J. J., et al. ZINC20-A free ultralarge-scale chemical database for ligand discovery. J Chem Inf Model. 60 (12), 6065-6073 (2020).
  14. Naveja, J. J., Medina-Franco, J. L. Finding constellations in chemical space through core analysis. Front Chem. 7, 510 (2019).
  15. Cavasotto, C. N., Di Filippo, J. I. Artificial intelligence in the early stages of drug discovery. Arch Biochem Biophys. 698, 108730 (2021).
  16. Rosén, J., Gottfries, J., Muresan, S., Backlund, A., Oprea, T. I. Novel chemical space exploration via natural products. J Med Chem. 52 (7), 1953-1962 (2009).
  17. Sliwoski, G., Kothiwale, S., Meiler, J., Lowe Jr, E. W. Computational methods in drug discovery. Pharmacol Rev. 66 (1), 334-395 (2014).
  18. Goyzueta-Mamani, L. D., Barazorda-Ccahuana, H. L., Mena-Ulecia, K., Chávez-Fumagalli, M. A. Antiviral activity of metabolites from Peruvian plants against SARS-CoV-2: An in silico approach. Molecules. 26 (13), 3882 (2021).
  19. Goyzueta-Mamani, L. D., et al. In silico analysis of metabolites from Peruvian native plants as potential therapeutics against Alzheimer's disease. Molecules. 27 (3), 918 (2022).
  20. Barazorda-Ccahuana, H. L., et al. Computer-aided drug design approaches applied to screen natural product's structural analogs targeting arginase in Leishmania spp. F1000Research. 12, 93 (2023).
  21. McGrady, M. Y., Colby, S. M., Nuñez, J. R., Renslow, R. S., Metz, T. O. AI for chemical space gap filling and novel compound generation. arXiv. , (2022).
  22. Medina-Franco, J., Martinez-Mayorga, K., Giulianotti, M., Houghten, R., Pinilla, C. Visualization of the chemical space in drug discovery. Curr Comput Aided-Drug Des. 4 (4), 322-333 (2008).
  23. Osolodkin, D. I., Radchenko, E. V., Orlov, A. A., Voronkov, A. E., Palyulin, V. A., Zefirov, N. S. Progress in visual representations of chemical space. Expert Opin Drug Discov. 10 (9), 959-973 (2015).
  24. Sheridan, R. P., Kearsley, S. K. Why do we need so many chemical similarity search methods. Drug Discov Today. 7 (17), 903-911 (2002).
  25. Singh, N., Guha, R., Giulianotti, M. A., Pinilla, C., Houghten, R. A., Medina-Franco, J. L. Chemoinformatic analysis of combinatorial libraries, drugs, natural products, and molecular libraries Small Molecule Repository. J Chem Inf Model. 49 (4), 1010-1024 (2009).
  26. Medina-Franco, J. L., Chávez-Hernández, A. L., López-López, E., Saldívar-González, F. I. Chemical multiverse: An expanded view of chemical space. Mol Inform. 41 (11), e2200116 (2022).

転載および許可

このJoVE論文のテキスト又は図を再利用するための許可を申請します

許可を申請

さらに記事を探す

ADME BIOFACQUIM NPDB

This article has been published

Video Coming Soon

JoVE Logo

個人情報保護方針

利用規約

一般データ保護規則

研究

教育

JoVEについて

Copyright © 2023 MyJoVE Corporation. All rights reserved