2.5K Views
•
08:21 min
•
April 13th, 2022
DOI :
April 13th, 2022
•0:04
Introduction
0:49
Software and File Downloads
1:42
Structure Generation Using MAYGEN
2:11
Filter Compounds with Undesired Substructures
3:31
Additional Structure Modifications and Descriptor Generation
5:22
Results: Chemical Space of All Filtered Amino Acid Libraries, Mean van der Waals Volumes and Mean XLogP Values of Libraries with and without Sulfur, and Effects of a Trivalent Pseudoatom on MAYGEN Structure Generation
7:22
Conclusion
Transcript
Il nostro protocollo dimostra come il software open source possa consentire a qualsiasi ricercatore di creare e curare una libreria di strutture computazionali. Questo appello ai protocolli deriva dalla sua apertura e flessibilità. Chiunque può usarlo e modificarlo per adattarlo alla propria domanda di ricerca specifica.
Le versioni di questo protocollo possono essere applicate alle applicazioni di scoperta di farmaci, creando rapidamente librerie di strutture specifiche per lo screening in silico. Sebbene il protocollo sia spiegato passo dopo passo, se gli utenti non hanno familiarità con Java o la codifica di base possono prima esaminarli prima di implementare il protocollo. Iniziare creando una nuova directory per il progetto.
Inserisci tutti i file e gli eseguibili in questa directory per un facile accesso. Scarica l'ultima versione di Maygen come file jar e il software di gestione dei pacchetti Anaconda. Sui sistemi Windows cercare il prompt di Anaconda e fare clic sul collegamento risultante da eseguire.
Per creare un ambiente RDKit in Anaconda e scaricare RDKit nell'ambiente, digitare il comando visualizzato sullo schermo, premere invio per eseguire e rispondere sì a eventuali domande che si presentano durante l'installazione. Quindi scarica i Quaderni Jupyter e i file di testo dei modelli di substrato dai file supplementari, da uno a cinque. Nel prompt dei comandi, passare alla directory contenente il maygen.
jar file eseguibile. Per ogni formula chimica di interesse utilizzare il comando mostrato sullo schermo per eseguire Maygen. Se la formula è una formula fuzzy anziché una formula discreta, sostituire il flag F del trattino con un flag fuzzy del trattino e racchiudere gli intervalli degli elementi tra parentesi.
In un prompt di Anaconda passare alla cartella contenente i Notebook Jupyter e attivare l'ambiente RDKit. I notebook scaricati richiedono RDKit. Quindi qualsiasi uso futuro di loro in questo protocollo richiederà che vengano aperti nell'ambiente RDKit.
Quindi, aprire Jupyter Notebook per il filtro della sottostruttura e chiudere il nome del file tra virgolette se contiene spazi. Nella cella designata all'inizio del blocco appunti immettere il percorso completo del file sdf di input. Il percorso completo del file di output sdf desiderato e il percorso del file di elenco non valido come stringhe.
Se è necessario mantenere alcune sottostrutture nella libreria filtrata o un buon elenco, creare un file txt di modelli SMARTS per tali sottostrutture e inserire il percorso del file di elenco valido nella riga designata all'inizio del blocco appunti. Dal menu in alto selezionare kernel, riavviare ed eseguire tutto per riavviare il kernel del notebook ed eseguire tutte le celle. Un file sdf con il nome desiderato verrà creato nella cartella di output specificata.
Ripetere questi passaggi per ogni file di struttura generato da Maygen. Per la sostituzione dello pseudoatomo aprire un prompt Anaconda, passare alla cartella contenente i notebook Jupyter e attivare l'ambiente RDKit. Quindi aprire jupyter notebook per la sostituzione dello pseudoatomo.
Nella cella designata all'inizio del blocco appunti immettere il percorso completo del file sdf di input e il percorso completo del file di output sdf desiderato come stringhe. Riavviare il kernel del notebook ed eseguire tutte le celle per ottenere un file sdf con il nome desiderato nella cartella di output specificata. Allo stesso modo, apri un prompt Anaconda per il capping degli amminoacidi N e C termini.
Passare alla cartella contenente i notebook Jupyter e attivare l'ambiente RDKit. Aprire jupyter Notebook per la limitazione degli aminoacidi. Nella cella designata all'inizio del blocco appunti immettere il percorso completo del file sdf di input e il percorso completo del file di output sdf desiderato come stringhe.
Riavviare il kernel del notebook ed eseguire tutte le celle per ottenere un file sdf con il nome desiderato nella cartella di output specificata. Per la generazione del descrittore, inserire tutti i file sdf per i quali i descrittori devono essere calcolati in un'unica cartella. Quindi scarica il descrittore PaDEL, decomprimilo ed estrailo in quella cartella.
Aprire un prompt dei comandi, passare alla cartella contenente il file jar del descrittore PaDEL ed eseguire il descrittore PaDEL per i file sdf raccolti. Lo spazio chimico di tutte le librerie di aminoacidi filtrati è mostrato qui. I marcatori neri rappresentano gli amminoacidi delle librerie senza zolfo e i marcatori gialli rappresentano gli amminoacidi delle librerie arricchite di zolfo.
Qui, le biblioteche VAIL e VAIL_S sono rappresentate da cerchi. Le biblioteche DEST e DEST_S sono rappresentate da quadrati. Le librerie prolina e Pro S sono rappresentate da triangoli e le stelle rappresentano amminoacidi codificati.
L'intervallo dei possibili valori di log P aumenta con il volume molecolare anche all'interno delle librerie che mancano esplicitamente di catene laterali idrofile. Gli amminoacidi codificati con catene laterali di idrocarburi sono più idrofobici della maggior parte degli altri amminoacidi di un volume comparabile dalla rispettiva libreria. Questo è anche il caso della metionina che insiste rispetto ad altri membri della biblioteca VAILS con volumi simili.
Gli amminoacidi codificati con catene laterali ossidriliche erano tra i membri più piccoli della libreria DEST con acido aspartico solo leggermente più grande di tre anine. L'immagine rappresentata mostra i volumi medi di Van der Waal di biblioteche con zolfo e senza zolfo. La sostituzione dello zolfo ha portato ad un leggero aumento del volume molecolare in tutte le librerie.
I valori medi del coefficiente di ripartizione delle librerie con e senza zolfo sono mostrati qui. L'effetto della sostituzione dello zolfo sul log P non è così omogeneo come per il volume. L'immagine rappresentativa mostra gli effetti di uno pseudoatomo trivalente sulla generazione della struttura di Maygen.
L'uso di uno pseudoatomo nella generazione di strutture ha ridotto il numero di strutture generate di circa tre ordini di grandezza nel tempo totale necessario per generare tali strutture di uno o due ordini di grandezza. Seguendo questo protocollo, in futuro possono essere integrate funzionalità aggiuntive in base alle esigenze dei ricercatori. Ad esempio, si potrebbero integrare filtri di sottostruttura in Maygen per evitare la fase di post-elaborazione.
Generazione, cura e modifica della libreria. Questo processo generale può ospitare altre strutture molecolari e modifiche con alcune conoscenze di codifica, che consentiranno ai ricercatori di esplorare librerie computazionali oltre a quelle degli amminoacidi alfa. Questo protocollo aiuterà i ricercatori a migliorare il loro lavoro computazionale nel campo delle origini della vita.
I toolkit open source saranno di grande aiuto a questi sforzi.
Lo scopo di questo protocollo è quello di generare e curare in modo efficiente librerie di strutture a piccole molecole utilizzando software open source.
Explore More Videos
ABOUT JoVE
Copyright © 2025 MyJoVE Corporation. All rights reserved