Unser Protokoll zeigt, wie Open-Source-Software es jedem Forscher ermöglichen kann, eine Computerstrukturbibliothek zu erstellen und zu kuratieren. Dieser Appell der Protokolle kommt von seiner Offenheit und Flexibilität. Jeder kann es verwenden und an seine spezifische Forschungsfrage anpassen.
Versionen dieses Protokolls können auf Anwendungen zur Wirkstoffforschung angewendet werden, wodurch schnell spezifische Strukturbibliotheken für das In-silico-Screening erstellt werden. Obwohl das Protokoll Schritt für Schritt erklärt wird, können Benutzer, die mit Java oder der grundlegenden Codierung nicht vertraut sind, diese vor der Implementierung des Protokolls zuerst ansehen. Erstellen Sie zunächst ein neues Verzeichnis für das Projekt.
Legen Sie alle Dateien und ausführbaren Dateien in diesem Verzeichnis ab, um den Zugriff zu erleichtern. Laden Sie die neueste Version von Maygen als JAR-Datei und die Paketverwaltungssoftware Anaconda herunter. Suchen Sie auf Windows-Systemen nach Anaconda-Eingabeaufforderung und klicken Sie auf die resultierende Verknüpfung, um ausgeführt zu werden.
Um eine RDKit-Umgebung in Anaconda zu erstellen und das RDKit in die Umgebung herunterzuladen, geben Sie den auf dem Bildschirm angezeigten Befehl ein, drücken Sie die Eingabetaste, um ausgeführt zu werden, und beantworten Sie alle Fragen, die während der Installation auftreten, mit Ja. Laden Sie dann die Jupyter Notebooks und Textdateien der Substratmuster aus den Ergänzungsdateien eins bis fünf herunter. Navigieren Sie in der Eingabeaufforderung zu dem Verzeichnis, das das maygen enthält.
ausführbare JAR-Datei. Verwenden Sie für jede chemische Formel von Interesse den Befehl, der auf dem Bildschirm angezeigt wird, um Maygen auszuführen. Wenn es sich bei der Formel um eine Fuzzy-Formel anstelle einer diskreten Formel handelt, ersetzen Sie das F-Flag mit Bindestrich durch ein Fuzzy-Flag mit Bindestrich, und schließen Sie alle Elementintervalle in Klammern ein.
Navigieren Sie in einer Anaconda-Eingabeaufforderung zu dem Ordner, der die Jupyter Notebooks enthält, und aktivieren Sie die RDKit-Umgebung. Für die heruntergeladenen Notebooks ist RDKit erforderlich. Jede zukünftige Verwendung von ihnen in diesem Protokoll erfordert daher, dass sie in der RDKit-Umgebung geöffnet werden.
Öffnen Sie als Nächstes das Jupyter Notebook für die Unterstrukturfilterung und schließen Sie den Dateinamen in Anführungszeichen, wenn er Leerzeichen enthält. Geben Sie in der dafür vorgesehenen Zelle am Anfang des Notizbuchs den vollständigen Dateipfad der Eingabe-SDF-Datei ein. Der vollständige Dateipfad der gewünschten SDF-Ausgabedatei und der Dateipfad der fehlerhaften Listendatei als Zeichenfolgen.
Wenn einige Unterstrukturen in der gefilterten Bibliothek oder eine gute Liste beibehalten werden müssen, erstellen Sie eine txt-Datei mit SMARTS-Mustern für diese Unterstrukturen und fügen Sie den Pfad der guten Listendatei in die angegebene Zeile am Anfang des Notebooks ein. Wählen Sie im Menü oben Kernel, starten Sie neu und führen Sie alle aus, um den Notebook-Kernel neu zu starten und alle Zellen auszuführen. Eine SDF-Datei mit dem gewünschten Namen wird im angegebenen Ausgabeordner erstellt.
Wiederholen Sie diese Schritte für jede von Maygen generierte Strukturdatei. Öffnen Sie für den Pseudoatom-Ersatz eine Anaconda-Eingabeaufforderung, navigieren Sie zu dem Ordner, der die Jupyter Notebooks enthält, und aktivieren Sie die RDKit-Umgebung. Öffnen Sie dann das Jupyter-Notizbuch für den Ersatz von Pseudoatomen.
Geben Sie in der dafür vorgesehenen Zelle am Anfang des Notizbuchs den vollständigen Dateipfad der sdf-Eingabedatei und den vollständigen Dateipfad der gewünschten sdf-Ausgabedatei als Zeichenfolgen ein. Starten Sie den Notebook-Kernel neu, und führen Sie alle Zellen aus, um eine SDF-Datei mit dem gewünschten Namen im angegebenen Ausgabeordner abzurufen. Öffnen Sie in ähnlicher Weise eine Anaconda-Eingabeaufforderung für die Kappung der Aminosäuren N und C.
Navigieren Sie zu dem Ordner, der die Jupyter Notebooks enthält, und aktivieren Sie die RDKit-Umgebung. Öffnen Sie das Jupyter Notebook für Aminosäure-Capping. Geben Sie in der dafür vorgesehenen Zelle am Anfang des Notizbuchs den vollständigen Dateipfad der sdf-Eingabedatei und den vollständigen Dateipfad der gewünschten sdf-Ausgabedatei als Zeichenfolgen ein.
Starten Sie den Notebook-Kernel neu, und führen Sie alle Zellen aus, um eine SDF-Datei mit dem gewünschten Namen im angegebenen Ausgabeordner abzurufen. Für die Deskriptorgenerierung legen Sie alle sdf-Dateien, für die Deskriptoren berechnet werden sollen, in einem einzigen Ordner ab. Laden Sie dann den PaDEL-Deskriptor herunter, entpacken Sie ihn und extrahieren Sie ihn in diesen Ordner.
Öffnen Sie eine Eingabeaufforderung, navigieren Sie zu dem Ordner, der die JAR-Datei des PaDEL-Deskriptors enthält, und führen Sie den PaDEL-Deskriptor für die gesammelten SDF-Dateien aus. Der chemische Raum aller gefilterten Aminosäurebibliotheken ist hier dargestellt. Schwarze Marker repräsentieren Aminosäuren aus den Bibliotheken ohne Schwefel und gelbe Marker repräsentieren Aminosäuren aus mit Schwefel angereicherten Bibliotheken.
Hier werden VAIL und VAIL_S Bibliotheken durch Kreise repräsentiert. DEST und DEST_S Bibliotheken werden durch Quadrate dargestellt. Prolin- und Pro S-Bibliotheken werden durch Dreiecke dargestellt und Sterne stellen codierte Aminosäuren dar.
Der Bereich der möglichen logarithmischen P-Werte nimmt mit dem molekularen Volumen auch innerhalb der Bibliotheken zu, denen explizit hydrophile Seitenketten fehlen. Kodierte Aminosäuren mit Kohlenwasserstoff-Seitenketten sind hydrophober als die meisten anderen Aminosäuren eines vergleichbaren Volumens aus ihrer jeweiligen Bibliothek. Dies gilt auch für Methionin insisting im Vergleich zu anderen Mitgliedern der VAILS-Bibliothek mit ähnlichen Volumen.
Kodierte Aminosäuren mit Hydroxylseitenketten gehörten zu den kleinsten Mitgliedern der DEST-Bibliothek, wobei Asparaginsäure nur geringfügig größer als drei Anine war. Das dargestellte Bild zeigt die mittleren Van-der-Waal-Bände von Bibliotheken mit Schwefel und ohne Schwefel. Die Schwefelsubstitution führte in allen Bibliotheken zu einem leichten Anstieg des molekularen Volumens.
Die mittleren Partitionskoeffizientenwerte von Bibliotheken mit und ohne Schwefel sind hier dargestellt. Die Wirkung der Schwefelsubstitution auf log P ist nicht so homogen wie auf das Volumen. Das repräsentative Bild zeigt die Auswirkungen eines dreiwertigen Pseudoatoms auf die Maygen-Strukturerzeugung.
Die Verwendung eines Pseudoatoms bei der Strukturgenerierung verringerte die Anzahl der erzeugten Strukturen um etwa drei Größenordnungen in der Gesamtzeit, die benötigt wurde, um diese Strukturen um ein bis zwei Größenordnungen zu erzeugen. Nach diesem Protokoll können in Zukunft zusätzliche Funktionalitäten integriert werden, die auf den Bedürfnissen der Forscher basieren. Zum Beispiel könnte man Unterstrukturfilter in Maygen integrieren, um den Nachbearbeitungsschritt zu vermeiden.
Bibliotheksgenerierung, -kuration und -änderung. Dieser allgemeine Prozess kann andere molekulare Strukturen und Modifikationen mit etwas Kodierungswissen aufnehmen, was es den Forschern ermöglicht, Computerbibliotheken zu erforschen, die über die von Alpha-Aminosäuren hinausgehen. Dieses Protokoll wird Forschern helfen, ihre Rechenarbeit in den Ursprüngen des Lebensfeldes zu verbessern.
Open-Source-Toolkits werden diese Bemühungen erheblich unterstützen.