私たちのプロトコルは、オープンソースソフトウェアが研究者が計算構造ライブラリを作成してキュレーションする方法を示しています。このプロトコルの魅力は、そのオープン性と柔軟性から来ています。誰でもそれを使用して、特定の研究課題に合わせて変更することができます。
このプロトコルのバージョンは、創薬アプリケーションに適用することができ、インシリコスクリーニング用の特定の構造ライブラリを迅速に作成できます。プロトコルは順を追って説明されていますが、ユーザーがJavaや基本的なコーディングに精通していない場合は、プロトコルを実装する前にまずそれらを見ることができます。まず、プロジェクトの新しいディレクトリを作成します。
すべてのファイルと実行可能ファイルをこのディレクトリに配置して、簡単にアクセスできるようにします。Maygen の最新バージョンを jar ファイルとしてダウンロードし、パッケージ管理ソフトウェア Anaconda をダウンロードします。Windowsシステムでは、Anacondaプロンプトを検索し、結果のショートカットをクリックして実行します。
Anaconda で RDKit 環境を作成し、RDKit を環境にダウンロードするには、画面に表示されるコマンドを入力し、Enter キーを押して実行し、インストール中に出た質問に「はい」と答えます。次に、Jupyter ノートブックと基板パターンのテキストファイルを補足ファイル(1〜5個)からダウンロードします。コマンドプロンプトで、Maygen を含むディレクトリに移動します。
jar 実行可能ファイル。目的の化学式ごとに、画面に表示されるコマンドを使用してMaygenを実行します。数式が離散数式ではなくファジー数式の場合は、ハイフン F フラグをハイフン ファジー フラグに置き換え、要素間隔を角かっこで囲みます。
Anaconda プロンプトで、Jupyter ノートブックを含むフォルダーに移動し、RDKit 環境をアクティブにします。ダウンロードしたノートブックには RDKit が必要です。したがって、このプロトコルで今後それらを使用するには、RDKit環境で開く必要があります。
次に、サブ構造フィルター処理のために Jupyter ノートブックを開き、スペースが含まれている場合はファイル名を引用符で囲みます。ノートブックの先頭にある指定されたセルに、入力 sdf ファイルの完全ファイル パスを入力します。目的の sdf 出力ファイルの完全ファイル パスと、不良リスト ファイルのファイル パスを文字列として指定します。
フィルタリングされたライブラリ内の一部のサブ構造または適切なリストを保持する必要がある場合は、それらのサブ構造のSMARTSパターンのtxtファイルを作成し、ノートブックの先頭の指定された行に適切なリストファイルパスを配置します。上部のメニューから [カーネル] を選択し、すべて再起動して実行し、ノートブックカーネルを再起動してすべてのセルを実行します。指定された出力フォルダに、希望の名前のsdfファイルが作成されます。
Maygen によって生成された各ストラクチャーファイルについて、これらの手順を繰り返します。擬似原子置換の場合は、Anaconda プロンプトを開き、Jupyter ノートブックを含むフォルダーに移動して、RDKit 環境をアクティブにします。次に、ジュパイターノートブックを開いて擬似原子を交換します。
ノートブックの先頭にある指定されたセルに、入力 sdf ファイルの完全ファイル パスと、目的の sdf 出力ファイルの完全ファイル パスを文字列として入力します。ノートブックカーネルを再起動し、すべてのセルを実行して、指定された出力フォルダに目的の名前のsdfファイルを取得します。同様に、アミノ酸N末端とC末端キャッピングのためのAnacondaプロンプトを開きます。
Jupyter ノートブックを含むフォルダーに移動し、RDKit 環境をアクティブにします。Jupyter ノートブックを開き、アミノ酸キャッピングを行います。ノートブックの先頭にある指定されたセルに、入力 sdf ファイルの完全ファイル パスと、目的の sdf 出力ファイルの完全ファイル パスを文字列として入力します。
ノートブックカーネルを再起動し、すべてのセルを実行して、指定された出力フォルダに目的の名前のsdfファイルを取得します。記述子の生成では、記述子を計算するすべての sdf ファイルを 1 つのフォルダーに配置します。次に、PaDEL記述子をダウンロードし、解凍してそのフォルダに解凍します。
コマンドプロンプトを開き、PaDEL 記述子 jar ファイルを含むフォルダーに移動し、収集された sdf ファイルに対して PaDEL 記述子を実行します。ここでは、ろ過されたすべてのアミノ酸ライブラリーの化学空間を示します。黒いマーカーは硫黄を含まないライブラリーからのアミノ酸を表し、黄色のマーカーは硫黄が豊富なライブラリーからのアミノ酸を表す。
ここでは、VAIL ライブラリとVAIL_Sライブラリは円で表されます。DEST ライブラリとDEST_Sライブラリは正方形で表されます。プロリンおよびPro Sライブラリは三角形で表され、星はコード化されたアミノ酸を表す。
可能な対数P値の範囲は、親水性側鎖を明示的に欠くライブラリー内であっても、分子体積とともに増加する。炭化水素側鎖を有するコード化されたアミノ酸は、それらのそれぞれのライブラリーからの同程度の体積の他のほとんどのアミノ酸よりも疎水性である。これは、メチオニンが同様のボリュームを持つVAILSライブラリの他のメンバーと比較して主張する場合にも当てはまります。
ヒドロキシル側鎖を有するコード化されたアミノ酸は、3つのアニンよりわずかに大きいアスパラギン酸を有するDESTライブラリーの最小メンバーの1つであった。表された画像は、硫黄と硫黄を含まないライブラリの平均ファンデルワール体積を示しています。硫黄置換は、すべてのライブラリーにおいて分子体積のわずかな増加をもたらした。
硫黄を含むライブラリと硫黄を含まないライブラリの平均分配係数値がここに示されています。log Pに対する硫黄置換の効果は、体積ほど均質ではない。代表的な画像は、マイゲン構造生成に対する3価の擬似原子の影響を示している。
構造生成に擬似原子を用いると、それらの構造を生成するのに必要な合計時間で約3桁、生成される構造の数が1〜2桁減少しました。このプロトコルに従って、研究者のニーズに基づいて、将来的には追加の機能を統合することができます。たとえば、下位構造フィルタをMaygenに統合して、後処理ステップを回避することができます。
ライブラリの生成、キュレーション、および変更。この一般的なプロセスは、いくつかのコーディング知識を持つ他の分子構造や修飾に対応することができ、研究者はアルファアミノ酸のものを超えた計算ライブラリを探索することができます。このプロトコルは、研究者が生命の起源分野での計算作業を強化するのに役立ちます。
オープンソースのツールキットは、これらの取り組みに大いに役立ちます。