Nosso protocolo demonstra como o software de código aberto pode permitir que qualquer pesquisador crie e faça a curadoria de uma biblioteca de estrutura computacional. Este apelo de protocolos vem de sua abertura e flexibilidade. Qualquer um pode usá-lo e modificá-lo para se adequar à sua pergunta específica de pesquisa.
Versões deste protocolo podem ser aplicadas a aplicações de detecção de drogas, criando rapidamente bibliotecas de estrutura específicas para a triagem de silico. Embora o protocolo seja explicado passo a passo, se os usuários não estão familiarizados com Java ou codificação básica, eles podem primeiro olhar para eles antes de implementar o protocolo. Comece criando um novo diretório para o projeto.
Coloque todos os arquivos e executáveis neste diretório para fácil acesso. Baixe a versão mais recente de Maygen como um arquivo de jarra e o software de gerenciamento de pacotes Anaconda. Nos sistemas windows procure por Anaconda prompt e clique no atalho resultante para executar.
Para criar um ambiente RDKit em Anaconda e baixar o RDKit para o ambiente, digite o comando mostrado na tela, pressione enter para executar e responda sim a quaisquer perguntas que surgirem durante a instalação. Em seguida, baixe os Cadernos Jupyter e arquivos de texto dos padrões de substrato dos arquivos suplementares, de um a cinco. No prompt de comando, navegue até o diretório contendo o maygen.
arquivo executável jar. Para cada fórmula química de interesse use o comando mostrado na tela para executar Maygen. Se a fórmula for uma fórmula difusa em vez de uma fórmula discreta, substitua a bandeira hífen F por uma bandeira difusa de hífen e inclua quaisquer intervalos de elementos em suportes.
Em um prompt anaconda navegar para a pasta contendo os Notebooks Jupyter e ativar o ambiente RDKit. Os notebooks baixados requerem RDKit. Assim, qualquer uso futuro deles neste protocolo exigirá que eles sejam abertos no ambiente RDKit.
Em seguida, abra o Caderno Jupyter para filtragem de subestrutura e feche o nome do arquivo entre aspas se ele contiver espaços. Na célula designada no início do notebook, insira o caminho completo do arquivo do arquivo sdf de entrada. O caminho completo do arquivo do arquivo de saída sdf desejado e o caminho do arquivo do arquivo de lista ruim como strings.
Se algumas subes estruturas na biblioteca filtrada ou uma boa lista precisarem ser retidas, crie um arquivo txt de padrões SMARTS para essas subescolédas e coloque o caminho do arquivo de boa lista na linha designada no início do notebook. No menu do kernel de seleção superior, reinicie e execute tudo para reiniciar o kernel do notebook e executar todas as células. Um arquivo sdf com o nome desejado será criado na pasta de saída especificada.
Repita essas etapas para cada arquivo de estrutura gerado pela Maygen. Para substituir pseudoatom abra um prompt Anaconda, navegue até a pasta que contém os Cadernos Jupyter e ative o ambiente RDKit. Em seguida, abra o Caderno Jupyter para substituição de pseudoatom.
Na célula designada no início do notebook, insira o caminho completo do arquivo sdf de entrada e o caminho completo do arquivo de arquivo do arquivo de saída sdf desejado como strings. Reinicie o kernel do notebook e execute todas as células para obter um arquivo sdf com o nome desejado na pasta de saída especificada. Da mesma forma, abra um prompt anaconda para o termini de aminoácido n e c.
Navegue até a pasta que contém os Cadernos Jupyter e ative o ambiente RDKit. Abra o Caderno Jupyter para tampar aminoácidos. Na célula designada no início do notebook, insira o caminho completo do arquivo sdf de entrada e o caminho completo do arquivo de arquivo do arquivo de saída sdf desejado como strings.
Reinicie o kernel do notebook e execute todas as células para obter um arquivo sdf com o nome desejado na pasta de saída especificada. Para a geração de descritores, coloque todos os arquivos sdf para os quais os descritores devem ser calculados em uma única pasta. Em seguida, baixe o descritor PaDEL, descompacte-o e extraia-o para essa pasta.
Abra um prompt de comando, navegue até a pasta contendo o arquivo de frasco de descritor PaDEL e execute o descritor PaDEL para os arquivos sdf coletados. O espaço químico de todas as bibliotecas de aminoácidos filtradas é mostrado aqui. Marcadores negros representam aminoácidos das bibliotecas sem enxofre e marcadores amarelos representam aminoácidos de bibliotecas enriquecidas com enxofre.
Aqui, as bibliotecas VAIL e VAIL_S são representadas por círculos. As bibliotecas DEST e DEST_S são representadas por praças. As bibliotecas Proline e Pro S são representadas por triângulos e as estrelas representam aminoácidos codificados.
A gama de possíveis valores de log P aumenta com o volume molecular mesmo dentro das bibliotecas que explicitamente carecem de cadeias laterais hidrofílicas. Aminoácidos codificados com cadeias laterais de hidrocarbonetos são mais hidrofóbicos do que a maioria dos outros aminoácidos de um volume comparável de sua respectiva biblioteca. Este também é o caso da insistência de methionina em comparação com outros membros da biblioteca VAILS com volumes semelhantes.
Aminoácidos codificados com cadeias laterais hidroxil estavam entre os menores membros da biblioteca DEST com ácido aspartíaco apenas ligeiramente maior que três Anine. A imagem representada mostra os volumes médios de Van der Waal de bibliotecas com enxofre e sem enxofre. A substituição de enxofre levou a um ligeiro aumento no volume molecular em todas as bibliotecas.
Os valores médios do coeficiente de partição das bibliotecas com e sem enxofre são mostrados aqui. O efeito da substituição de enxofre no log P não é tão homogêneo quanto para o volume. A imagem representativa mostra os efeitos de um pseudoatom trivalente na geração da estrutura de Maygen.
O uso de um pseudoatom na geração de estruturas diminuiu o número de estruturas geradas por cerca de três ordens de magnitude no tempo total necessário para gerar essas estruturas por uma a duas ordens de magnitude. Seguindo esse protocolo, funcionalidades adicionais podem ser integradas no futuro com base nas necessidades dos pesquisadores. Por exemplo, pode-se integrar filtros de subestrução ao Maygen para evitar a etapa pós-processamento.
Geração de bibliotecas, curadoria e modificação. Este processo geral pode acomodar outras estruturas moleculares e modificações com alguns conhecimentos de codificação, o que permitirá aos pesquisadores explorar bibliotecas computacionais além das de aminoácidos alfa. Este protocolo ajudará os pesquisadores a aprimorar seu trabalho computacional nas origens do campo da vida.
Os kits de ferramentas de código aberto ajudarão muito a esses esforços.