As concentrações atmosféricas de aglomerados moleculares fracamente ligados podem ser computadas a partir das propriedades termoquímicas de estruturas de baixa energia encontradas através de uma metodologia de amostragem configuracional de várias etapas utilizando um algoritmo genético e química quântica semi-empírica e ab initio.
O estudo computacional da formação e crescimento de aerossóis atmosféricos requer uma superfície de energia livre gibbs precisa, que pode ser obtida a partir da estrutura eletrônica da fase do gás e cálculos de frequência vibracional. Essas quantidades são válidas para esses aglomerados atmosféricos cujas geometrias correspondem a um mínimo em suas superfícies energéticas potenciais. A energia livre gibbs da estrutura de energia mínima pode ser usada para prever concentrações atmosféricas do aglomerado sob uma variedade de condições como temperatura e pressão. Apresentamos um procedimento computacionalmente barato construído em uma amostragem de configuração baseada em algoritmo genético seguida por uma série de cálculos de triagem cada vez mais precisos. O procedimento começa gerando e evoluindo as geometrias de um grande conjunto de configurações usando modelos semi-empíricos e, em seguida, refina as estruturas únicas resultantes em uma série de níveis de teoria ab initio de alto nível. Finalmente, as correções termodinâmicas são calculadas para o conjunto resultante de estruturas de energia mínima e usadas para calcular as energias livres de formação, constantes de equilíbrio e concentrações atmosféricas. Apresentamos a aplicação deste procedimento ao estudo de aglomerados de glicina hidratado em condições ambientais.
O parâmetro mais incerto nos estudos atmosféricos da mudança climática é a extensão exata em que as partículas de nuvens refletem a radiação solar recebida. Os aerossóis, que são material particulado suspenso em um gás, formam partículas de nuvens chamadas núcleos de condensação de nuvens (CCN) que espalham radiação recebida, impedindo assim sua absorção e o subsequente aquecimento da atmosfera1. Uma compreensão detalhada desse efeito de resfriamento líquido requer uma compreensão do crescimento dos aerossóis em CCNs, o que, por sua vez, requer uma compreensão do crescimento de pequenos aglomerados moleculares em partículas de aerossol. Trabalhos recentes sugerem que a formação de aerossol é iniciada por aglomerados moleculares de 3 nm de diâmetro ou menos2; no entanto, este regime de tamanho é de difícil acesso usando técnicas experimentais3,4. Portanto, deseja-se uma abordagem computacional de modelagem para superar essa limitação experimental.
Usando nossa abordagem de modelagem descrita abaixo, podemos analisar o crescimento de qualquer cluster hidratado. Como estamos interessados no papel da água na formação de grandes moléculas biológicas de constituintes menores em ambientes pré-bióticos, ilustramos nossa abordagem com glicina. Os desafios encontrados e as ferramentas necessárias para abordar essas questões de pesquisa são muito semelhantes aos envolvidos no estudo de aerossóis atmosféricos e aglomerados de prenucleação55,6,,77,88,9,,10,,11,,12,,13,,14,,15. Aqui, examinamos aglomerados de glicina hidratados a partir de uma molécula de glicina isolada, seguida por uma série de adições stepwise de até cinco moléculas de água. O objetivo final é calcular as concentrações de equilíbrio dos aglomerados Gly(H2O)n=0-5 na atmosfera a temperatura ambiente ao nível do mar e uma umidade relativa (RH) de 100 %.
Um pequeno número desses aglomerados moleculares subnanômetros cresce em um aglomerado crítico metastável (1-3 nm de diâmetro) adicionando outras moléculas de vapor ou coagulando em aglomerados existentes. Esses clusters críticos têm um perfil de crescimento favorável que leva à formação de núcleos de condensação de nuvens muito maiores (até 50-100 nm) (CCN), que afetam diretamente a eficiência de precipitação das nuvens, bem como sua capacidade de refletir a luz incidente. Portanto, ter uma boa compreensão da termodinâmica dos aglomerados moleculares e suas distribuições de equilíbrio deve levar a previsões mais precisas do impacto dos aerossóis no clima global.
Um modelo descritivo de formação de aerossóis requer termodinâmica precisa da formação de aglomerados moleculares. A computação de termodinâmica precisa da formação de clustermolecular requer a identificação das configurações mais estáveis, o que envolve encontrar a minima global e local na superfície potencial de energia do cluster (PES)16. Este processo é chamado de amostragem configuracional e pode ser alcançado através de uma variedade de técnicas, incluindo as baseadas na dinâmica molecular (DM)17,18,19,20, Monte Carlo (MC)21,22, e algoritmos genéticos (GA)23,24,25.
Diferentes protocolos foram desenvolvidos ao longo dos anos para obter a estrutura e a termodinâmica dos hidratos atmosféricos em um alto nível de teoria. Esses protocolos diferem na escolha do (i) método de amostragem configuracional, (ii) natureza do método de baixo nível utilizado na amostragem configuracional e (iii) a hierarquia dos métodos de nível superior utilizados para refinar os resultados nas etapas subsequentes.
Os métodos de amostragem configuracional incluíram intuição química26, amostragem aleatória27,28, dinâmica molecular (DM)29,30, salto de bacia (BH)31, e algoritmo genético (GA)24,25,32. Os métodos de baixo nível mais comuns empregados com esses métodos de amostragem são campos de força ou modelos semi-empíricos como PM6, PM7 e SCC-DFTB. Estes são frequentemente seguidos por cálculos DFT com conjuntos de base cada vez maiores e funcionais mais confiáveis dos degraus mais altos da escada de Jacó33. Em alguns casos, estes são seguidos por métodos de função de onda de nível mais alto, como MP2, CCSD(T) e o custo eficiente DLPNO-CCSD(T)34,35.
Kildgaard et al.36 desenvolveram um método sistemático onde moléculas de água são adicionadas em pontos nas esferas de Fibonacci37 em torno de pequenos aglomerados hidratados ou não hidratados para gerar candidatos para aglomerados maiores. Candidatos não físicos e redundantes são removidos com base em limiares de contato próximos e distância quadrada entre diferentes conformers. Otimizações subseqüentes usando o método semi-empírico PM6 e uma hierarquia de métodos de DFT e função de onda são usadas para obter um conjunto de conformers de baixa energia em um alto nível de teoria.
O algoritmo da colônia de abelhas artificiais (ABC)38 é uma nova abordagem de amostragem de configuração que foi recentemente implementada por Zhang et al. para estudar clusters moleculares em um programa chamado ABCluster39. Kubecka et al.40 utilizaram o ABCluster para amostragem de configuração seguido de reotimizações de baixo nível usando o método semi-empírico GFN-xTB de ligação apertada41. Eles refinaram ainda mais as estruturas e energias usando métodos DFT seguidos de energias finais usando DLPNO-CCSD(T).
Independentemente do método, a amostragem configuracional começa com uma distribuição de pontos gerada aleatoriamente ou não no PES. Cada ponto corresponde a uma geometria específica do aglomerado molecular em questão e é gerada pelo método de amostragem. Em seguida, o mínimo local mais próximo é encontrado para cada ponto seguindo a direção "downhill" no PES. O conjunto de minima assim encontrado corresponde às geometrias do aglomerado molecular que são estáveis, pelo menos por algum tempo. Aqui, a forma do PES e a avaliação da energia em cada ponto da superfície serão sensíveis à descrição física do sistema onde uma descrição física mais precisa resulta em um cálculo de energia mais computacionalmente caro. Utilizaremos especificamente o método GA implementado no programa OGOLEM25, que foi aplicado com sucesso a uma variedade de problemas globais de otimização e amostragem de configuração42,,43,,44,45,para gerar o conjunto inicial de pontos de amostragem. O PES será descrito pelo modelo PM746 implementado no programa MOPAC201647. Essa combinação é empregada porque gera uma variedade maior de pontos em comparação com os métodos MD e MC e encontra o minima local mais rápido do que descrições mais detalhadas do PES.
O conjunto de minima locais otimizados por GA são tomados como geometrias iniciais para uma série de etapas de triagem, que levam a um conjunto de energia mínima baixa. Esta parte do protocolo começa otimizando o conjunto de estruturas otimizadas por GA exclusivas usando a teoria de densidade funcional (DFT) com um pequeno conjunto de bases. Este conjunto de otimizações geralmente dará um conjunto menor de estruturas mínimas locais únicas que são modeladas com mais detalhes em comparação com as estruturas semi-empíricas otimizadas pelo GA. Em seguida, outra rodada de otimizações de DFT são realizadas neste conjunto menor de estruturas usando um conjunto de basemaior. Mais uma vez, esta etapa geralmente dará um conjunto menor de estruturas únicas que são modeladas com mais detalhes em comparação com o pequeno passo dft base. O conjunto final de estruturas únicas são então otimizados para uma convergência mais apertada e as frequências vibracionais harmônicas são calculadas. Após esta etapa temos tudo o que precisamos para calcular as concentrações de equilíbrio dos aglomerados na atmosfera. A abordagem geral é resumida diagramaticamente na Figura 1. Utilizaremos a aproximação de gradiente generalizadaPW91 48 (GGA) na implementação gaussiana49 do DFT, juntamente com duas variações do conjunto base Pople50 (6-31+G* para a pequena etapa base e 6-311++G** para a grande etapa base). Esta combinação particular de conjunto funcional e de base de correlação de troca foi escolhida devido ao seu sucesso anterior na computação precisa de energias livres de formação de Gibbs para aglomerados atmosféricos51,52.
Este protocolo pressupõe que o usuário tenha acesso a um cluster de computação de alto desempenho (HPC) com o sistema de lote portátil53 (PBS), MOPAC2016 (http://openmopac.net/MOPAC2016.html)47, OGOLEM (https://www.ogolem.org)25, Gaussian 09 (https://gaussian.com)49e OpenBabel54 (http://openbabel.org/wiki/Main_Page) software instalado seguindo suas instruções específicas de instalação. Cada etapa deste protocolo também usa um conjunto de scripts shell interno e Python 2.7 que devem ser salvos em um diretório que está incluído na variável $PATH ambiental do usuário. Todos os módulos ambientais necessários e permissões de execução para executar todos os programas acima também devem ser carregados na sessão do usuário. O uso de disco e memória pelo código GA (OGOLEM) e códigos semi-empíricos (MOPAC) são muito pequenos para os padrões modernos de recursos do computador. O uso geral de memória e disco para OGOLEM/MOPAC depende de quantos threads se quer usar e, mesmo assim, o uso de recursos será pequeno em comparação com as capacidades da maioria dos sistemas HPC. As necessidades de recursos dos métodos QM dependem do tamanho dos clusters e do nível de teoria utilizado. A vantagem de usar este protocolo é que se pode variar o nível da teoria para poder calcular o conjunto final de estruturas de baixa energia, tendo em mente que geralmente cálculos mais rápidos levam a mais incerteza na precisão dos resultados.
Para uma questão de clareza, o computador local do usuário será referido como "computador local", enquanto o cluster HPC a que eles têm acesso será referido como "cluster remoto".
1. Encontrar a estrutura de energia mínima de glicina isolada e água
NOTA: O objetivo aqui é duas vezes: (i) obter estruturas energéticas mínimas de moléculas isoladas de água e glicina para uso na amostragem de configuração do algoritmo genético, (ii) e calcular as correções termodinâmicas das energias da fase gasosa dessas moléculas para uso no cálculo das concentrações atmosféricas.
2. Amostragem de configuração baseada em algoritmo genético de aglomerados Gly(H2O)n=1-5
NOTA: O objetivo aqui é obter um conjunto de estruturas de baixa energia para Gly(H2O)n=1-5 no nível semi-empírico barato da teoria, utilizando o modelo PM746 implementado no MOPAC47. É imprescindível que o diretório de trabalho tenha a organização e estrutura exatas como mostra a Figura 2. Isso é para garantir que os scripts personalizados shell e Python funcionem sem falhas.
3. Refinamento usando o método QM com um pequeno conjunto de base
NOTA: O objetivo aqui é refinar a amostragem de configuração dos clusters Gly(H2O)n=1-5 usando uma melhor descrição quântica-mecânica para obter um conjunto menor, mas mais preciso, de estruturas de cluster Gly(H2O)n=1-5. As estruturas de partida para esta etapa são as saídas do Passo 2.
4. Refinamento adicional usando o método QM com um conjunto de bases grande
NOTA: O objetivo aqui é refinar ainda mais a amostragem de configuração dos clusters Gly(H2O)n=1-5 usando uma melhor descrição quântica-mecânica. As estruturas de partida para esta etapa são as saídas do Passo 3.
5. Cálculos finais de energia e correção termodinâmica
NOTA: O objetivo aqui é obter a estrutura vibracional e as energias dos aglomerados Gly(H2O)n=1-5 usando um conjunto de base grande e uma grade de integração ultrafina, a fim de calcular as correções termoquímicas desejadas.
6. Computação de concentrações atmosféricas de Gly(H2O)n=0-5 aglomerados à temperatura ambiente ao nível do mar
NOTA: Isso é feito primeiro copiando os dados termodinâmicos gerados na etapa anterior em uma planilha e calculando as energias livres de Gibbs de hidratação sequencial. Em seguida, as energias livres gibbs são usadas para calcular constantes de equilíbrio para cada hidratação seqüencial. Finalmente, um conjunto de equações lineares são resolvidos para obter a concentração de equilíbrio dos hidratos para uma dada concentração de monômeros, temperatura e pressão.
O primeiro conjunto de resultados deste protocolo deve ser um conjunto de estruturas de baixa energia de Gly(H2O)n=1-5 encontradas através do procedimento de amostragem configuracional. Essas estruturas foram otimizadas no nível de teoria PW91/6-311++G** e são consideradas precisas para o propósito deste artigo. Não há evidências que sugiram que o PW91/6-311++G** subestime ou superestime consistentemente a energia vinculante desses clusters. Sua capacidade de prever energias vinculantes em relação a MP2/CBS32 e [DLPNO-]CCSD(T)/CBS60,61 estimativas e experimento52 mostra muitas flutuações. O mesmo acontece com a maioria das outras funcionais de densidade. Geralmente, cada valor de n = 1 – 5 deve produzir um punhado de estruturas de baixa energia dentro de cerca de 5 kcal mol-1 da estrutura de menor energia. Aqui, focamos na primeira estrutura produzida pelo roteiro run-thermo-pw91.csh para brevidade. A Figura 3 mostra os menores isômeros de energia eletrônica dos aglomerados Gly(H2O)n=0-5. Pode-se ver que a rede de ligação de hidrogênio cresce em complexidade à medida que o número de moléculas de água aumenta, e até passa de uma rede planar principalmente para uma estrutura tridimensional semelhante a uma gaiola em n = 5. O restante deste texto utiliza as energias e quantidades termodinâmicas correspondentes a esses cinco clusters específicos.
A Tabela 1 contém as quantidades termodinâmicas necessárias para a realização do protocolo. A Tabela 2 mostra um exemplo da saída do script run-thermo-pw91.csh onde as energias eletrônicas, correções vibracionais de ponto zero e as correções termodinâmicas a três temperaturas diferentes são impressas. Para cada cluster (linha), E[PW91/6-311++G**] corresponde às energias eletrônicas de fase de gás no nível de teoria PW91/6-311++G** calculado em grades de integração ultrafinas em unidades de Hartree, bem como a energia vibracional de ponto zero(ZPVE)em unidades de kcal mol-1. A cada temperatura, 216,65 K, 273,15 K e 298,15 K, as correções termodinâmicas são listadas, ¥H a entalpia de formação em unidades de kcal mol-1, S a entropia de formação em unidades de cal mol-1, e ¥G a gibbs livre energia de formação em unidades de kcal mol-1. A Tabela 3 mostra um exemplo de computação da mudança de energia total de Gibbs livre de hidratação, bem como para hidratação seqüencial. Um exemplo de computação da mudança de energia livre de Gibbs total para a reação
começa com o cálculo da energia eletrônica EPW91 como
onde EPW91[Gly⁄(H2O)] é retirado da tabela 2 coluna C, e EPW91[Gly] e EPW91[H2O] são retirados da coluna B da Tabela 1. Em seguida, calculamos a mudança de energia total da fase do gás ΔE(0) incluindo a mudança na energia vibracional de ponto zero da reação como
para obter a coluna D. Aqui, ΔEPW91/6-311++G** é tirada da coluna C da Tabela 3, EZPVE[Gly ◗ (H2O)] da Tabela 2 coluna D, e EZPVE[Gly] e EZPVE[H2O] da Coluna 1 coluna C. Por uma questão de brevidade, passaremos para clusters de temperatura ambiente, então pulamos os dados de 216,65 K e 273,15 K. À temperatura ambiente, então calculamos a mudança entalpia da reação ΔH corrigindo a mudança de energia da fase do gás como
onde ΔE(0) é retirado da tabela 3 coluna D, ΔH[Gly⁄(H2O)] é retirado da tabela 2 coluna K, e ΔH[Gly] e ΔH[H2O] são retirados da tabela 1 coluna J. Finalmente, calculamos a mudança de energia livre Gibbs da reação ΔG como
onde ΔH é retirado da coluna I da Tabela 3, S[Gly⁄(H2O)] é retirado da tabela 2 coluna L, e S[Gly] e S[H2O] são retirados da tabela 1 coluna K. Observe aqui que os valores de entropia devem ser convertidos em unidades de kcal mol-1 K-1 durante esta etapa.
Temos agora as quantidades necessárias para calcular as concentrações atmosféricas de glicina hidratada, como mostrado no Passo 6. Os resultados devem se assemelhar aos dados apresentados na Tabela 4,mas pequenas diferenças numéricas são esperadas. A Tabela 4 mostra as concentrações de hidrato de equilíbrio encontradas a partir da formulação do sistema de seis equações na Etapa 6.2 em uma equação matricial e sua solução subsequente. Começamos reconhecendo o fato de que o sistema de equações pode ser escrito como
onde Kn é a constante de equilíbrio para a hidratação sequencial nth de glicina, w é a concentração de água na atmosfera, g é a concentração inicial de glicina isolada na atmosfera, e gn é a concentração de equilíbrio de Gly(H2O)n. Se reescrevermos a equação acima como Ax = b,obtemos x = A−1b onde A−1 é o inverso da matriz A. Este inverso pode ser facilmente computado usando funções de planilha incorporadas, como mostrado na Tabela 4 para obter os resultados finais.
A Figura 4 mostra a concentração de equilíbrio da glicina hidratada calculada na Tabela 4 em função da temperatura a 100% de umidade relativa e 1 pressão atmosférica. Mostra que, à medida que a temperatura diminui de 298,15K para 216,65K, a concentração de glicina não hidratada (n=0) diminui e as de glicina hidratada aumentam. O dihidrato de glicina (n=2) em particular aumenta drasticamente com a temperatura decrescente, enquanto a mudança na concentração de outros hidratos é menos perceptível. Esta correlação inversa entre temperatura e concentração hidratada é consistente com a expectativa de que as energias livres de Gibbs de hidratação a temperaturas mais baixas favoreçam a formação de hidratos.
A Figura 5 ilustra a dependência da umidade relativa da concentração de equilíbrio de hidratos de glicina a 298,15K e 1 pressão atmosférica. Demonstra claramente que, à medida que o RH aumenta de 20% para 100%, a concentração de hidratados (n>0) aumenta em detrimento da glicina não hidratada (n=0). Mais uma vez, a correlação direta entre a umidade relativa e a concentração de hidratos é consistente com a ideia de que a presença de mais moléculas de água no RH mais alto promove a formação de hidratos.
Como apresentado, este protocolo dá uma compreensão qualitativa das populações de glicina hidratada na atmosfera. Assumindo uma concentração inicial de glicina isolada de 2,9 milhões de moléculas por centímetro cúbico, vemos que a glicina não hidratada (n=0) é a espécie mais abundante na maioria das condições, exceto T=216,65K e RH=100%. O dihidrato (n=2), que tem a menor energia livre sequencial de Gibbs de hidratação em todas as três temperaturas, é o hidratado mais abundante nas condições aqui consideradas. Prevê-se que o monohidrato (n=1) e os hidratos maiores (n≥3) sejam encontrados em quantidades insignificantes. Após a inspeção da Figura 3,a abundância dos aglomerados n = 1-4 pode estar relacionada à estabilidade e tensão na rede de ligação de hidrogênio dos aglomerados. Esses aglomerados têm as moléculas de água de hidrogênio ligadas ao ácido carboxílico moiety de glicina em uma geometria muito semelhante à de várias estruturas de anel ligados a hidrogênio, tornando-as especialmente estáveis.
Figura 1: Descrição esquemmática do procedimento atual. Um grande conjunto de estruturas de adivinhação geradas pelo algoritmo genético (GA) é refinado por uma série de otimizações de geometria PW91 até que um conjunto de estruturas convergentes sejam obtidos. As freqüências vibracionais dessas estruturas são computadas e usadas para calcular a energia livre de formação de Gibbs, que por sua vez é usada para calcular as concentrações de equilíbrio dos aglomerados em condições ambientais. Clique aqui para ver uma versão maior desta figura.
Figura 2: Estrutura representativa do diretório para cada cluster. Os scripts interno incluídos neste protocolo requerem a estrutura do diretório mostrada acima, onde n é o número de moléculas de água. Para cada n em gly-h2o-n,existem os seguintes subdiretórios: GA para algoritmo genético com um diretório GA/pm7, QM para mecânica quântica com QM/pw91-sb para PW91/6-31+G*, QM/pw91-lb para PW91/6-311++G**, e QM/pw91-lb/ultrafine para otimizações e cálculos vibracionais finais em grades de integração ultrafina. Clique aqui para ver uma versão maior desta figura.
Figura 3: Estruturas representativas de baixa energia de Gly(H2O)n=0-5. Esses clusters foram o minima global de energia eletrônica otimizado no nível de teoria PW91/6-311++G***. Clique aqui para ver uma versão maior desta figura.
Figura 4: Dependência de temperatura de Gly(H2O)n=0-5 como 100% umidade relativa e 1 pressão de atm. A concentração dos hidratos é dada em unidades de moléculas cm-3. Clique aqui para ver uma versão maior desta figura.
Figura 5: Dependência de umidade relativa de Gly(H2O)n=0-5 como 298,15 K e 1 pressão de atm. A concentração dos hidratos é dada em unidades de moléculas cm-3. Clique aqui para ver uma versão maior desta figura.
E[PW91/6-311++G**] | 216,65 Mil | 273,15 Mil | 298,15 Mil | ||||||||
LB-UF | ZPVE | ♦H | S | ♦G | ♦H | S | ♦G | ♦H | S | ♦G | |
Água | -76.430500 | 13.04 | 1.72 | 42.59 | 5.54 | 2.17 | 44.44 | 3.08 | 2.37 | 45.14 | 1.96 |
Glicina | -284.434838 | 48.55 | 2.65 | 69.53 | 36.14 | 3.70 | 73.81 | 32.09 | 4.22 | 75.61 | 30.22 |
Tabela 1: Energias monômeras. As energias eletrônicas estão em unidades de Hartree, enquanto todas as outras quantidades estão em unidades de kcal mol-1. A água e a glicina foram otimizadas no nível de teoria e frequências vibracionais PW91/6-311++G**. As correções termodinâmicas para uma pressão de 1 atm e temperatura de 298,15 K foram calculadas utilizando-se o script thermo.pl.
E[PW91/6-311++G**] | 0 K | 216,65 Mil | 273,15 Mil | 298,15 Mil | ||||||||
N | Nome | LB-UF | ZPVE | ♦H | S | ♦G | ♦H | S | ♦G | ♦H | S | ♦G |
1 | gly-h2o-1 | -360.88481 | 63.96 | 3.61 | 80.12 | 50.22 | 5.12 | 86.27 | 45.52 | 5.85 | 88.83 | 43.33 |
2 | gly-h2o-2 | -437.33763 | 79.33 | 4.53 | 90.86 | 64.17 | 6.46 | 98.78 | 58.81 | 7.40 | 102.06 | 56.30 |
3 | gly-h2o-3 | -513.78620 | 94.52 | 5.67 | 105.08 | 77.42 | 8.08 | 114.94 | 71.19 | 9.23 | 119.00 | 68.27 |
4 | gly-h2o-4 | -590.23667 | 109.80 | 6.03 | 104.98 | 91.30 | 8.78 | 116.21 | 84.40 | 10.11 | 120.87 | 81.14 |
5 | gly-h2o-5 | -666.68845 | 125.80 | 7.26 | 121.70 | 106.69 | 10.47 | 134.83 | 99.44 | 12.01 | 140.24 | 96.00 |
Tabela 2: Energias de cluster. As energias das estruturas gly(H2O)de menor energia encontradas usando nosso procedimento descrito na Figura 1. As energias eletrônicas estão em unidades de Hartree, enquanto todas as outras quantidades estão em unidades de kcal mol-1.
Hidratação Total: Gly + nH2O <-> Gly(H2O)n | Hidratação Sequencial: Gly(H2O)n-1 + H2O <-> Gly(H2O)n | ||||||||||||||||
E[PW91/6-311++G**] | 216.65 | 273.15 | 298.15 | 216.65 | 273.15 | 298.15 | |||||||||||
N | nome do sistema | LB-UF | ♦E(0) | ♦H(T) | ♦G(T) | ♦H(T) | ♦G(T) | ♦H(T) | ♦G(T) | LB-UF | ♦E(0) | ♦H(T) | ♦G(T) | H(T) | ♦G(T) | ♦H(T) | ♦G(T) |
1 | gly-h2o-1 | -12.22 | -9.85 | -10.61 | -3.68 | -10.61 | -1.87 | -10.59 | -1.07 | -12.22 | -9.85 | -10.61 | -3.68 | -10.61 | -1.87 | -10.59 | -1.07 |
2 | gly-h2o-2 | -26.22 | -21.53 | -23.10 | -9.27 | -23.11 | -5.66 | -23.09 | -4.06 | -14.00 | -11.68 | -12.49 | -5.59 | -12.50 | -3.79 | -12.50 | -2.99 |
3 | gly-h2o-3 | -37.56 | -30.72 | -32.88 | -12.90 | -32.87 | -7.69 | -32.82 | -5.38 | -11.34 | -9.19 | -9.78 | -3.63 | -9.76 | -2.03 | -9.73 | -1.32 |
4 | gly-h2o-4 | -50.10 | -40.34 | -43.48 | -15.87 | -43.54 | -8.71 | -43.51 | -5.55 | -12.54 | -9.62 | -10.60 | -2.97 | -10.67 | -1.02 | -10.69 | -0.17 |
5 | gly-h2o-5 | -63.45 | -51.41 | -55.42 | -20.58 | -55.51 | -11.48 | -55.48 | -7.45 | -13.35 | -11.07 | -11.94 | -4.71 | -11.97 | -2.77 | -11.97 | -1.90 |
Tabela 3: Energias de hidratação. A energia total de hidratação e energia de hidratação seqüencial para Gly(H2O)n=1-5 em unidades de kcal mol-1. Aqui, E[PW91/6-311++G**] é a mudança na energia eletrônica, ¥E(0) é a energia vibracional de ponto zero (ZPVE) corrigida mudança de energia, ¥H(T) é a mudança de entalpia na temperatura T, e ¥G(T) é a mudança de energia livre de Gibbs de hidratação de cada aglomerado Gly(H2O)n=1-5.
Distribuição de Hidratação do Equilíbrio em função da temperatura e umidade relativa | |||||||||
T=298,15K | T=273.15K | T=216,65K | |||||||
Gly(H2O)n | RH=100% | RH=50% | RH=20% | RH=100% | RH=50% | RH=20% | RH=100% | RH=50% | RH=20% |
0 | 1.3E+06 | 2.2E+06 | 2.7E+06 | 1.1E+06 | 2.0E+06 | 2.7E+06 | 6.1E+05 | 1.5E+06 | 2.5E+06 |
1 | 2.3E+05 | 1.9E+05 | 9.5E+04 | 2.0E+05 | 1.9E+05 | 9.9E+04 | 1.2E+05 | 1.5E+05 | 9.5E+04 |
2 | 1.0E+06 | 4.3E+05 | 8.4E+04 | 1.3E+06 | 6.1E+05 | 1.3E+05 | 1.8E+06 | 1.1E+06 | 3.0E+05 |
3 | 2.8E+05 | 5.8E+04 | 4.5E+03 | 3.2E+05 | 7.4E+04 | 6.3E+03 | 3.1E+05 | 9.6E+04 | 1.0E+04 |
4 | 1.1E+04 | 1.1E+03 | 3.4E+01 | 1.3E+04 | 1.5E+03 | 5.0E+01 | 1.1E+04 | 1.8E+03 | 7.5E+01 |
5 | 7.5E+03 | 3.9E+02 | 4.9E+00 | 1.2E+04 | 7.2E+02 | 9.7E+00 | 2.4E+04 | 1.9E+03 | 3.1E+01 |
Tabela 4: Concentrações de hidrato de equilíbrio de Gly(H2O)n=0-5 como temperatura de função (T=298,15K, 273,15K, 216,65K) e umidade relativa (RH=100%, 50%, 20%). A concentração dos hidratos é dada em unidades de moléculas cm-3 assumindo valores experimentais56,57,58, de [Gly]0 = 2,9 x 106 cm-3 e [H2O] = 7,7 x 1017 cm-3, 1,6 x 1017 cm-3 e 9,9 x 1014 cm-3 a 100% umidade relativa e T = 298,15 K, 273,15 K, e 216,65 K, respectivamente59.
Arquivos Suplementares. Clique aqui para baixar esses arquivos.
A precisão dos dados gerados por este protocolo depende principalmente de três coisas: (i) a variedade de configurações amostrados pela Etapa 2, (ii) a precisão da estrutura eletrônica do sistema, (iii) e a precisão das correções termodinâmicas. Cada um desses fatores pode ser abordado modificando o método editando os scripts incluídos. O primeiro fator é facilmente superado com o uso de um maior pool inicial de estruturas geradas aleatoriamente, mais numerosas iterações do Ga, e uma definição mais frouxa dos critérios envolvidos no Ga. Além disso, pode-se usar um método semi-empírico diferente, como o modelo de tight-binding tight-binding (SCC-DFTB)62 e o modelo potencial de fragmento efetivo (EFP)63, a fim de explorar os efeitos de diferentes descrições físicas. A principal limitação aqui é a incapacidade do método de formar ou quebrar ligações covalentes, o que significa que os monômeros estão congelados. O procedimento de AG encontra apenas as posições relativas mais estáveis desses monômeros congelados de acordo com a descrição semi-empírica.
A precisão da estrutura eletrônica do sistema pode ser melhorada de várias maneiras, cada uma com seu custo computacional. Pode-se escolher uma melhor densidade funcional, como m06-2X64 e wB97X-V65, ou métodos mecânicos quânticos (QM) como as teorias de perturbação Møller-Plesset66,67,68 (MPn) e métodos de cluster acoplado69 (CC) a fim de melhorar a descrição física do sistema. Na hierarquia das funcionais, o desempenho geralmente melhora ao passar de funis de aproximação de gradiente generalizado (GGA) como PW91 para funções híbridas separadas em faixa, como funções híbridas wB97X-D e meta-GGA como M06-2X.
A desvantagem dos métodos DFT é que não é possível uma convergência sistemática para um valor preciso; no entanto, os métodos DFT são computacionalmente baratos e há uma grande variedade de funcionais para uma grande variedade de aplicações.
Energias calculadas usando métodos de função de onda como MP2 e CCSD(T) em conjunto com conjuntos de base consistentes de correlação de aumento do número cardeal ([aug-]cc-pV[D,T,Q,...] Z) convergem para seu limite completo de fixação de base sistematicamente, mas o custo computacional de cada cálculo torna-se proibitivo à medida que o tamanho do sistema cresce. Um refinamento adicional da estrutura eletrônica pode ser realizado usando conjuntos de base explicitamente correlacionados70 e extrapolando para o limite completo do conjunto de base (CBS)71. Nosso trabalho recente sugere que uma abordagem perturbativa de segunda ordem explicitamente correlacionada de segunda ordem Møller-Plesset (DF-MP2-F12) produz energias que se aproximam das computações MP2/CBS32. A modificação do protocolo atual para usar diferentes métodos de estrutura eletrônica envolve duas etapas: (i) preparar um arquivo de entrada de modelo seguindo a sintaxe dada pelo software, (ii) e editar a sintaxe de arquivo de entrada run-pw91-sb.csh, run-pw91-lb.csh,e scripts run-pw91-lb-ultrafine.csh para gerar a sintaxe de arquivo de entrada correta, bem como o script de envio correto para o software.
Por fim, a precisão das correções termodinâmicas depende do método de estrutura eletrônica, bem como da descrição do PES em torno do mínimo global. Uma descrição precisa do PES requer a computação de derivados de terceira e alta ordem do PES em relação aos deslocamentos nos graus nucleares de liberdade, como o campo de força quartic72,73 (QFF), que é uma tarefa excepcionalmente cara. O protocolo atual utiliza a aproximação harmônica do oscilador às frequências vibracionais, resultando na necessidade de calcular apenas até os segundos derivados do PES. Essa abordagem torna-se problemática em sistemas com alta anharmonicidade, como moléculas muito disquetes e potenciais simétricos de dois poços devido à grande diferença no verdadeiro PES e no PES harmônico. Além disso, o custo de ter um PES de alta qualidade a partir de um método de estrutura eletrônica computacionalmente exigente só compõe o problema do custo para os cálculos de frequência vibracional. Uma abordagem para superar isso é usar as energias eletrônicas a partir de um cálculo de estrutura eletrônica de alta qualidade, juntamente com frequências vibracionais computadas em um PES de menor qualidade, resultando em um equilíbrio entre custo e precisão. O protocolo atual pode ser modificado para usar diferentes descrições de PES como descrito no parágrafo anterior; no entanto, pode-se também editar as palavras-chave de freqüência vibracional nos scripts e modelos para calcular frequências vibracionais anharmônicas.
Duas questões cruciais para qualquer protocolo de amostragem configuracional são o método inicial para a amostragem da superfície de energia potencial e os critérios utilizados para identificar cada cluster. Fizemos uso extensivo de uma variedade de métodos em nosso trabalho anterior. Para a primeira questão, o método inicial de amostragem da superfície potencial de energia, fizemos a escolha de usar a AI com métodos semi-empíricos com base nesses fatores. A amostragem configuracional utilizando intuição química26,amostragem aleatória e dinâmica molecular (DM)29,30,não encontra ma global putativo regularmente para aglomerados maiores que 10 monômeros, como observamos em nossos estudos de aglomerados de água18. Temos usado com sucesso o salto de bacia (BH) para estudar o complexo PES de (H2O)1174,mas exigiu a inclusão manual de alguns potenciais isôsimos de baixa energia que o algoritmo de BH não encontrou. Uma comparação do desempenho de BH e GA em encontrar o mínimo global de aglomerados de água, (H2O)n=10-20 demonstrou que a Ga encontrou consistentemente o mínimo global mais rápido que BH75. Ga como implementado no OGOLEM e CLUSTER é muito versátil porque pode ser aplicado a qualquer cluster molecular e pode interagir com um grande número de pacotes com capacidades clássicas de campo de força, semi-empírica, funcional de densidade e ab initio. A escolha do PM7 é impulsionada por sua velocidade e precisão razoável. Praticamente qualquer outro método semi-empírico teria um custo computacional significativamente maior.
Quanto à segunda edição, exploramos utilizando diferentes critérios para identificar estruturas únicas que vão desde energias eletrônicas, momentos dipolo, sobreposição de RMSDs e constantes rotacionais. O uso de momentos de dipolo mostrou-se difícil porque tanto os componentes do momento do dipolo dependiam da orientação da molécula quanto o momento total do dipolo era muito sensível às diferenças de geometria de tal forma que era difícil definir limiares determinando se as estruturas são iguais ou únicas. Uma combinação de energias eletrônicas e constantes rotacionais provou ser mais útil.
O critério atual para a análise de duas estruturas únicas baseia-se em um limiar de diferença de energia de 0,10 kcal mol-1 e diferença constante rotacional de 1%. Portanto, duas estruturas são consideradas diferentes se suas energias diferem em mais de 0,10 kcal mol-1 (~0,00015 a.u.) E qualquer uma de suas três constantes rotacionais (A, B, C) diferem em mais de 1%. Referências internas substanciais ao longo dos anos consideraram esses limiares escolhas razoáveis. Nossa metodologia de abordagem e triagem de configuração tem sido aplicada a aglomerados muito fracos, como hidrocarbonetos poliaromáticos complexos com água76,77, bem como hidratos de sulfato ternário fortemente ligados contendo amônia e aminas32. Para clusters onde há diferentes estados de protonação a serem considerados, a melhor abordagem é executar vários cálculos de A, cada um começando com monômeros em diferentes estados de protonação. Isso garante que estruturas com diferentes estados de protonação sejam cuidadosamente consideradas. No entanto, os cálculos dft de baixo nível muitas vezes permitem que os estados de protonação mudem durante o curso da otimização da geometria, produzindo assim o estado de protonação mais estável, independentemente da geometria inicial.
Nossos métodos de amostragem de configuração ga devem funcionar bem mesmo para moléculas disquetes, desde que os códigos GA sejam interfaceados com métodos gerais e não parametrizados que permitem que os monômeros adotem diferentes configurações durante o curso da execução de GA. Por exemplo, a interligação de Ga com o PM7 permitiria que as estruturas dos monômeros mudassem, mas se seus vínculos se rompessem como aconteceria quando os estados de protonação mudassem, as estruturas podem ser descartadas como candidatos inaceitáveis.
Consideramos diferentes formas de corrigir as deficiências da aproximação harmônica, especialmente aquelas decorrentes de baixas frequências vibracionais. Incorporar a aproximação quase harmônica na metodologia atual não é difícil. No entanto, ainda há dúvidas sobre o método quase harmônico, especialmente quando se trata da frequência de corte abaixo da qual será aplicado. Além disso, não há trabalhos rigorosos de benchmarking examinando a confiabilidade da aproximação quase-RRHO, embora a sabedoria convencional sugira que deve ser uma melhoria em relação à aproximação da RRHO.
O protocolo assim apresentado pode ser generalizado para qualquer sistema de aglomerados moleculares de fase de gás não covalentemente ligados. Também pode ser generalizado para usar qualquer método semi-empírico, método de estrutura eletrônica e software, e método de análise vibracional e software editando os scripts e modelos. Isso pressupõe que o usuário esteja confortável com a interface de linha de comando Linux, scripting Python e computação de alto desempenho. A sintaxe e o visual desconhecidos do sistema operacional Linux e a falta de experiência em scripts é a maior armadilha neste protocolo e é onde os novos alunos mais lutam. Este protocolo tem sido usado com sucesso em uma variedade de implementações durante anos em nosso grupo, focando principalmente nos efeitos do ácido sulfúrico e amônia na formação de aerossóis. Outras melhorias neste protocolo envolverão uma interface mais robusta para software de estrutura mais eletrônica, implementações alternativas do algoritmo genético e, possivelmente, o uso de métodos mais novos para cálculos mais rápidos de energias eletrônicas e vibracionais. Nossas aplicações atuais deste protocolo estão explorando a importância dos aminoácidos nos estágios iniciais da formação de aerossóis na atmosfera atual e na formação de moléculas biológicas maiores em ambientes prebióticos.
Nenhum.
Este projeto foi apoiado pelas subvenções CHE-1229354, CHE-1662030, CHE-1721511 e CHE-1903871 da National Science Foundation (GCS), do Arnold and Mabel Beckman Foundation Beckman Scholar Award (AGG) e da Barry M. Goldwater Scholarship (AGG). Foram utilizados recursos de computação de alto desempenho do Consórcio MERCURY (http://www.mercuryconsortium.org).
Name | Company | Catalog Number | Comments |
Avogadro | https://avogadro.cc | Open-source molecular visualization program | |
Gaussian [09/16] Software | http://www.gaussian.com/ | Commercial ab initio electronic structure program | |
MOPAC 2016 | http://openmopac.net/MOPAC2016.html | Open-source semi-empirical program | |
OGOLEM Software | https://www.ogolem.org | Genetic algorithm-based global optimization program | |
OpenBabel | http://openbabel.org/wiki/Main_Page | Open-source cheminformatics library | |
calcRotConsts.py | Shields Group, Department of Chemistry, Furman University | Python script to compute rotational constants | |
calcSymmetry.csh | Shields Group, Department of Chemistry, Furman University | Shell script to calculate symmetry number of a molecule given Cartesian coordinates | |
combine-GA.csh | Shields Group, Department of Chemistry, Furman University | Shell script to combine energy and rotational constants from different GA directories | |
combine-QM.csh | Shields Group, Department of Chemistry, Furman University | Shell script to combine energy and rotational constants from different QM directories | |
gaussianE.csh | Shields Group, Department of Chemistry, Furman University | Shell script to extract Gaussian 09 energies | |
gaussianFreqs.csh | Shields Group, Department of Chemistry, Furman University | Shell script to extract Gaussian 09 vibrational frequencies | |
getrotconsts | Shields Group, Department of Chemistry, Furman University | Executable to calculate rotational constants given a molecule's Cartesian coordinates | |
getRotConsts-dft-lb.csh | Shields Group, Department of Chemistry, Furman University | Shell script to compute rotational constants for a batch of large basis DFT optimized structures | |
getRotConsts-dft-lb-ultrafine.csh | Shields Group, Department of Chemistry, Furman University | Shell script to compute rotational constants for a batch of ultrafine DFT optimized structures | |
getRotConsts-dft-sb.csh | Shields Group, Department of Chemistry, Furman University | Shell script to compute rotational constants for a batch of small basis DFT optimized structures | |
getRotConsts-GA.csh | Shields Group, Department of Chemistry, Furman University | Shell script to compute rotational constants for a batch of genetic algorithm optimized structures | |
global-minimum-coords.xyz | Shields Group, Department of Chemistry, Furman University | Cartesian coordinates of global minimum structures of gly-(h2o)n, where n=0-5 | |
make-thermo-gaussian.csh | Shields Group, Department of Chemistry, Furman University | Shell script to extract data from Gaussian output files and make input files for the thermo.pl script | |
ogolem-input-file.ogo | Shields Group, Department of Chemistry, Furman University | Ogolem sample input file | |
ogolem-submit-script.pbs | Shields Group, Department of Chemistry, Furman University | PBS batch submission file for Ogolem calculations | |
README.docx | Shields Group, Department of Chemistry, Furman University | Clarifications to help readers use the scripts effectively | |
runogolem.csh | Shields Group, Department of Chemistry, Furman University | Shell script to run OGOLEM | |
run-pw91-lb.csh | Shields Group, Department of Chemistry, Furman University | Shell script to run a batch of large basis DFT optimization calculations | |
run-pw91-lb-ultrafine.csh | Shields Group, Department of Chemistry, Furman University | Shell script to run a batch of ultrafine DFT optimization calculations | |
run-pw91-sb.csh | Shields Group, Department of Chemistry, Furman University | Shell script to run a batch of small basis DFT optimization calculations | |
run-thermo-pw91.csh | Shields Group, Department of Chemistry, Furman University | Shell script to compute the thermodynamic corrections for a batch of DFT optimized structures | |
similarityAnalysis.py | Shields Group, Department of Chemistry, Furman University | Python script to determine unique structures based on rotational constants and energies | |
symmetry | Shields Group, Department of Chemistry, Furman University | Executable to calculate molecular symmetry given Cartesian coordinates | |
symmetry.c | (C) 1996, 2003 S. Patchkovskii, Serguei.Patchkovskii@sympatico.ca | C code to determine the molecular symmstry of a molecule given Cartesian coordinates | |
template-marcy.pbs | Shields Group, Department of Chemistry, Furman University | Template for a PBS submit script which uses OGOLEM | |
template-pw91.com | Shields Group, Department of Chemistry, Furman University | Template Gaussian 09 input | |
template-pw91-HL.com | Shields Group, Department of Chemistry, Furman University | Template Gaussian 09 input for ultrafine DFT optimization | |
thermo.pl | https://www.nist.gov/mml/csd/chemical-informatics-research-group/products-and-services/program-computing-ideal-gas | Perl open-source script to compute ideal gas thermodynamic corrections | |
gly-h2o-n.xlsx | Shields Group, Department of Chemistry, Furman University | Excel spreadsheet for the complete protocol | |
table-1.xlsx | Shields Group, Department of Chemistry, Furman University | Excel spreadsheet | |
table-2.xlsx | Shields Group, Department of Chemistry, Furman University | Excel spreadsheet | |
table-3.xlsx | Shields Group, Department of Chemistry, Furman University | Excel spreadsheet | |
table-4.xlsx | Shields Group, Department of Chemistry, Furman University | Excel spreadsheet | |
water.xyz | Shields Group, Department of Chemistry, Furman University | Cartesian coordinates of water | |
glycine.xyz | Shields Group, Department of Chemistry, Furman University | Cartesian coordinates of glycine |
Solicitar permissão para reutilizar o texto ou figuras deste artigo JoVE
Solicitar PermissãoThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Todos os direitos reservados