Method Article
Las concentraciones atmosféricas de cúmulos moleculares débilmente unidos se pueden calcular a partir de las propiedades termoquímicas de las estructuras de baja energía que se encuentran a través de una metodología de muestreo configurational de varios pasos utilizando un algoritmo genético y una química cuántica semiempírica y ab initio.
El estudio computacional de la formación y crecimiento de aerosoles atmosféricos requiere una superficie de energía libre de Gibbs precisa, que se puede obtener de la estructura electrónica de fase de gas y los cálculos de frecuencia vibratoria. Estas cantidades son válidas para aquellos cúmulos atmosféricos cuyas geometrías corresponden a un mínimo en sus superficies de energía potenciales. La energía libre de Gibbs de la estructura de energía mínima se puede utilizar para predecir las concentraciones atmosféricas del racimo en una variedad de condiciones tales como temperatura y presión. Presentamos un procedimiento computacionalmente barato basado en un muestreo de configuración basado en algoritmos genéticos seguido de una serie de cálculos de cribado cada vez más precisos. El procedimiento comienza generando y evolucionando las geometrías de un gran conjunto de configuraciones utilizando modelos semiempíricos y luego refina las estructuras únicas resultantes en una serie de niveles de teoría ab initio de alto nivel. Por último, las correcciones termodinámicas se calculan para el conjunto resultante de estructuras de energía mínima y se utilizan para calcular las energías libres de Formación, constantes de equilibrio y concentraciones atmosféricas de Gibbs. Presentamos la aplicación de este procedimiento al estudio de racimos de glicina hidratada en condiciones ambientales.
El parámetro más incierto en los estudios atmosféricos del cambio climático es la medida exacta en que las partículas de nubes reflejan la radiación solar entrante. Los aerosoles, que son partículas suspendidas en un gas, forman partículas de nubes llamadas núcleos de condensación de nubes (CCN) que dispersan la radiación entrante, evitando así su absorción y el posterior calentamiento de la atmósfera1. Una comprensión detallada de este efecto de enfriamiento neto requiere una comprensión del crecimiento de aerosoles en CCN, lo que a su vez requiere una comprensión del crecimiento de pequeños racimos moleculares en partículas de aerosol. Trabajos recientes han sugerido que la formación de aerosoles se inicia mediante racimos moleculares de 3 nm de diámetro o menos2; sin embargo, este régimen de tamaño es difícil de acceder utilizando técnicas experimentales3,4. Por lo tanto, se desea un enfoque de modelado computacional para superar esta limitación experimental.
Utilizando nuestro enfoque de modelado que se describe a continuación, podemos analizar el crecimiento de cualquier racimo hidratado. Debido a que estamos interesados en el papel del agua en la formación de grandes moléculas biológicas a partir de componentes más pequeños en entornos prebióticos, ilustramos nuestro enfoque con glicina. Los retos encontrados y las herramientas necesarias para abordar esas cuestiones de investigación son muy similares a los que intervienen en el estudio de aerosoles atmosféricos y grupos de prenucleación5,6,7,8,9,10,11,12,13,14,15. Aquí, examinamos los racimos de glicina hidratados a partir de una molécula de glicina aislada seguida de una serie de adiciones escalonadas de hasta cinco moléculas de agua. El objetivo final es calcular las concentraciones de equilibrio de gly(H2O)n-0-5 clusters en la atmósfera a temperatura ambiente a nivel del mar y una humedad relativa (RH) del 100 %.
Un pequeño número de estos cúmulos moleculares subnanómetros se convierten en un cúmulo crítico metastable (1-3 nm de diámetro) ya sea mediante la adición de otras moléculas de vapor o la coagulación en los racimos existentes. Estos cúmulos críticos tienen un perfil de crecimiento favorable que conduce a la formación de núcleos de condensación de nubes mucho más grandes (hasta 50-100 nm) (CCN), que afectan directamente a la eficiencia de precipitación de las nubes, así como a su capacidad para reflejar la luz incidente. Por lo tanto, tener una buena comprensión de la termodinámica de los cúmulos moleculares y sus distribuciones de equilibrio debería conducir a predicciones más precisas del impacto de los aerosoles en el clima global.
Un modelo descriptivo de formación de aerosoles requiere una termodinámica precisa de la formación de racimos moleculares. El cómputo de la termodinámica precisa de la formación de racimos moleculares requiere la identificación de las configuraciones más estables, lo que implica encontrar el mínimo global y local en la superficie de energía potencial del clúster (PES)16. Este proceso se denomina muestreo de configuración y se puede lograr a través de una variedad de técnicas, incluidas las basadas en la dinámica molecular (MD)17,,18,19,20,Monte Carlo (MC)21,,22,y algoritmos genéticos (GA)23,,24,25.
A lo largo de los años se han desarrollado diferentes protocolos para obtener la estructura y la termodinámica de los hidratos atmosféricos a un alto nivel de teoría. Estos protocolos diferían en la elección de (i) método de muestreo de configuración, (ii) naturaleza del método de bajo nivel utilizado en el muestreo de configuración, y (iii) la jerarquía de métodos de nivel superior utilizados para refinar los resultados en los pasos posteriores.
Los métodos de muestreo de configuración incluyeron intuición química26,muestreo aleatorio27,28,dinámica molecular (MD)29,30,salto de cuenca (BH)31,y algoritmo genético (GA)24,,25,32. Los métodos de bajo nivel más comunes empleados con estos métodos de muestreo son campos de fuerza o modelos semiempíricos como PM6, PM7 y SCC-DFTB. Estos son seguidos a menudo por cálculos DFT con conjuntos de base cada vez más grandes y funciones más confiables de los peldaños más altos de la escalera33de Jacob. En algunos casos, estos son seguidos por métodos de función de onda de nivel superior como MP2, CCSD(T), y el rentable DLPNO-CCSD(T)34,35.
Kildgaard y otros36 desarrollaron un método sistemático en el que las moléculas de agua se añaden en puntos en las esferas de Fibonacci37 alrededor de racimos más pequeños hidratados o no hidratados para generar candidatos para racimos más grandes. Los candidatos no físicos y redundantes se eliminan en función de los umbrales de contacto cercanos y la distancia entre diferentes conformadores. Las optimizaciones posteriores utilizando el método semiempírico PM6 y una jerarquía de métodos DFT y wavefunction se utilizan para obtener un conjunto de conformadores de baja energía en un alto nivel de teoría.
El algoritmo38 de la colonia de abejas artificiales (ABC) es un nuevo enfoque de muestreo configurational que ha sido implementado recientemente por Zhang y otros para estudiar los cúmulos moleculares en un programa llamado ABCluster39. 40 utilizaron ABCluster para el muestreo de configuración seguido de reoptimizaciones de bajo nivel utilizando el método semiempírico GFN-xTB41de unión ajustada. Refinaron aún más las estructuras y energías utilizando métodos DFT seguidos de energías finales usando DLPNO-CCSD(T).
Independientemente del método, el muestreo de configuración comienza con una distribución aleatoria o no aleatoria de puntos en el PES. Cada punto corresponde a una geometría específica del cúmulo molecular en cuestión y es generado por el método de muestreo. A continuación, se encuentra el mínimo local más cercano para cada punto siguiendo la dirección "descenso" en el PES. El conjunto de mínimos así encontrados corresponden a aquellas geometrías del cúmulo molecular que son estables, al menos durante algún tiempo. Aquí, la forma del PES y la evaluación de la energía en cada punto de la superficie serán sensibles a la descripción física del sistema donde una descripción física más precisa resulta en un cálculo de energía más costoso computacionalmente. Utilizaremos específicamente el método GA implementado en el programa OGOLEM25, que se ha aplicado con éxito a una variedad de problemas de optimización global y muestreo de configuración42,,43,,44,,45,para generar el conjunto inicial de puntos de muestreo. El PES será descrito por el PM7 modelo46 implementado en el programa MOPAC201647. Esta combinación se emplea porque genera una mayor variedad de puntos en comparación con los métodos MD y MC y encuentra el mínimo local más rápido que las descripciones más detalladas del PES.
El conjunto de mínimos locales optimizados para GA se toman como geometrías iniciales para una serie de pasos de cribado, que conducen a un conjunto de energía mínima de baja altitud. Esta parte del protocolo comienza optimizando el conjunto de estructuras únicas optimizadas para GA utilizando la teoría de la densidad-funcional (DFT) con un pequeño conjunto de bases. Este conjunto de optimizaciones generalmente dará un conjunto más pequeño de estructuras mínimas locales únicas que se modelan con más detalle en comparación con las estructuras semiempíricas optimizadas para GA. A continuación, se realiza otra ronda de optimizaciones DFT en este conjunto más pequeño de estructuras utilizando un conjunto de base más grande. Una vez más, este paso generalmente dará un conjunto más pequeño de estructuras únicas que se modelan con más detalle en comparación con el paso DFT de base pequeña. El conjunto final de estructuras únicas se optimizan a una convergencia más estricta y se calculan las frecuencias vibratorias armónicas. Después de este paso tenemos todo lo que necesitamos para calcular las concentraciones de equilibrio de los cúmulos en la atmósfera. El enfoque general se resume diagramamáticamente en la Figura 1. Utilizaremos la correlación de intercambio PW9148 de aproximación de gradiente generalizado (GGA) funcional en la implementación Gaussian0949 de DFT junto con dos variaciones del conjunto de base Pople50 (6-31+G* para el paso de base pequeño y 6-311++G** para el paso de base grande). Esta combinación particular de conjunto funcional y base de correlación de intercambio fue elegida debido a su éxito anterior en la computación de energías libres Gibbs precisas de formación para los clusters atmosféricos51,52.
Este protocolo supone que el usuario tiene acceso a un clúster de computación de alto rendimiento (HPC) con el sistema por lotes portátil53 (PBS), MOPAC2016 (http://openmopac.net/MOPAC2016.html)47, OGOLEM (https://www.ogolem.org)25, Gaussian 09 (https://gaussian.com)49y OpenBabel54 (http://openbabel.org/wiki/Main_Page) software instalado siguiendo sus instrucciones de instalación específicas. Cada paso de este protocolo también utiliza un conjunto de scripts internos de shell y Python 2.7 que deben guardarse en un directorio que se incluye en la variable de entorno $PATH del usuario. Todos los módulos ambientales necesarios y permisos de ejecución para ejecutar todos los programas anteriores también deben cargarse en la sesión del usuario. El uso de disco y memoria por el código GA (OGOLEM) y los códigos semiempíricos (MOPAC) son muy pequeños según los estándares modernos de recursos informáticos. El uso general de memoria y disco para OGOLEM/MOPAC depende de cuántos subprocesos se quieran utilizar, e incluso entonces, el uso de recursos será pequeño en comparación con las capacidades de la mayoría de los sistemas HPC. Las necesidades de recursos de los métodos QM dependen del tamaño de los clústeres y del nivel de teoría utilizado. La ventaja de utilizar este protocolo es que se puede variar el nivel de teoría para poder calcular el conjunto final de estructuras de baja energía, teniendo en cuenta que por lo general los cálculos más rápidos conducen a una mayor incertidumbre en la precisión de los resultados.
En aras de la claridad, el equipo local del usuario se denominará"equipo local",mientras que el clúster de HPC al que tienen acceso se denominará"clúster remoto".
1. Encontrar la estructura energética mínima de glicina y agua aisladas
NOTA: El objetivo aquí es doble: (i) obtener estructuras energéticas mínimas de moléculas aisladas de agua y glicina para su uso en el muestreo configurational del algoritmo genético, (ii) y calcular las correcciones termodinámicas a las energías de fase gaseosa de estas moléculas para su uso en el cálculo de las concentraciones atmosféricas.
2. Muestreo de configuración basado en algoritmos genéticos de gly(H2O)n-1-5 clusters
NOTA: El objetivo aquí es obtener un conjunto de estructuras de baja energía para Gly(H2O)n-1-5 en el nivel semiempírico de bajo costo de la teoría, utilizando el modelo PM746 implementado en MOPAC47. Es imperativo que el directorio de trabajo tenga la organización y la estructura exactas como se muestra en la Figura 2. Esto es para asegurarse de que el shell personalizado y los scripts de Python funcionan sin errores.
3. Refinamiento utilizando el método QM con una base pequeña establecida
NOTA: El objetivo aquí es refinar el muestreo de configuración de los clústeres Gly(H2O)n-1-5 utilizando una mejor descripción cuántica-mecánica para obtener un conjunto más pequeño pero más preciso de estructuras de clúster Gly(H2O)n-1-5. Las estructuras iniciales para este paso son las salidas del paso 2.
4. Mayor refinamiento utilizando el método QM con una gran base establecida
NOTA: El objetivo aquí es refinar aún más el muestreo de configuración de los clústeres Gly(H2O)n-1-5 utilizando una mejor descripción cuántica-mecánica. Las estructuras iniciales para este paso son las salidas del paso 3.
5. Cálculos finales de energía y corrección termodinámica
NOTA: El objetivo aquí es obtener la estructura vibratoria y las energías de los clústeres Gly(H2O)n-1-5 utilizando un conjunto de base grande y una cuadrícula de integración ultrafina para calcular las correcciones termoquímicas deseadas.
6. Calcular las concentraciones atmosféricas de Gly(H2O)n.o 0-5 racimos a temperatura ambiente a nivel del mar
NOTA: Esto se logra copiando primero los datos termodinámicos generados en el paso anterior en una hoja de cálculo y calculando las energías libres de Gibbs de hidratación secuencial. Luego, las energías libres de Gibbs se utilizan para calcular las constantes de equilibrio para cada hidratación secuencial. Finalmente, se resuelve un conjunto de ecuaciones lineales para obtener la concentración de equilibrio de los hidratos para una concentración dada de monómeros, temperatura y presión.
El primer conjunto de resultados de este protocolo debe ser un conjunto de estructuras de baja energía de Gly(H2O)n-1-5 que se encuentran a través del procedimiento de muestreo de configuración. Estas estructuras se han optimizado en el nivel de teoría PW91/6-311+G** y se supone que son precisas para el propósito de este artículo. No hay evidencia que sugiera que PW91/6-311++G** subestime o sobreestime constantemente la energía de unión de estos clústeres. Su capacidad para predecir energías de unión en relación con MP2/CBS32 y [DLPNO-]CCSD(T)/CBS60,61 estimaciones y experimento52 muestra una gran cantidad de fluctuaciones. Lo mismo ocurre con la mayoría de las otras funciones de densidad. Por lo general, cada valor de n - 1 – 5 debe producir un puñado de estructuras de baja energía dentro de alrededor de 5 kcal mol-1 de la estructura de menor energía. Aquí, nos centramos en la primera estructura producida por el script run-thermo-pw91.csh para la brevedad. La Figura 3 muestra los isómeros de energía electrónica más bajos de los clústeres de Gly(H2O)n-0-5. Se puede ver que la red de enlaces de hidrógeno crece en complejidad a medida que aumenta el número de moléculas de agua, e incluso pasa de una red mayoritariamente plana a una estructura tridimensional similar a una jaula en n.o 5. El resto de este texto utiliza las energías y cantidades termodinámicas correspondientes a estos cinco clusters específicos.
La Tabla 1 contiene las cantidades termodinámicas necesarias para llevar a cabo el protocolo. La Tabla 2 muestra un ejemplo de la salida del script run-thermo-pw91.csh donde se imprimen las energías electrónicas, las correcciones vibratorias de punto cero y las correcciones termodinámicas a tres temperaturas diferentes. Para cada clúster (fila), E[PW91/6-311+G**] corresponde a las energías electrónicas de fase gaseosa en el nivel de teoría PW91/6-311++G** calculado en redes de integración ultrafinas en unidades de Hartree, así como la energía vibratoria de punto cero (ZPVE) en unidades de kcal mol-1. A cada temperatura, 216.65 K, 273.15 K, y 298.15 K, se enumeran las correcciones termodinámicas, H la entalpía de formación en unidades de kcal mol-1, S la entropía de formación en unidades de molcal -1, y G la energía libre de formación Gibbs en unidades de molkcal -1. La Tabla 3 muestra un ejemplo de cálculo del cambio total de energía libre de Gibbs de hidratación, así como para la hidratación secuencial. Un ejemplo de cálculo del cambio total de energía libre de Gibbs de hidratación para la reacción
comienza con el cómputo de la energía electrónica EPW91 como
donde EPW91[Gly(H2O)] se toma de la Columna 2 De la columna C, y EPW91[Gly] y EPW91[H2O] se toman de la Columna 1 de la columna B. A continuación, calculamos el cambio total de energía de la fase gaseosaE(0) incluyendo el cambio en la energía vibratoria de punto cero de la reacción como
para obtener la columna D. En este punto, el CuadroPW91/6-311+G** se toma de la Columna 3 de la columna C, EZPVE[Gly á (H2O)] de la Tabla 2 de la columna D, y EZPVE[Gly] y EZPVE[H2O] de la Columna 1 C. En aras de la brevedad, pasaremos a los clústeres de temperatura ambiente, por lo que nos saltamos los datos de 216,65 K y 273,15 K. A temperatura ambiente, calculamos el cambio de entalpía de la reacciónH corrigiendo el cambio de energía de la fase gaseosa como
donde se tomaE(0) de la columna D de la Tabla 3, setoman de la Tabla 1 [Gly-(H2O)] y se toman los puntosdela columna K de la Tabla 2, y los siguientes los datos de la tabla H [Gly] y el valor De [Gly] y el valor H [Gly] y el valor deH[H2O] se toman de la columna J de la Tabla 1. Por último, calculamos el cambio de energía libre de Gibbs de la reacciónG como
En los casos en que se tomaH de la columna 3 I, S[Gly-(H2O)] se toma de la tabla 2 de la columna L, y S[Gly] y S[H2O] se toman de la tabla 1 de la columna K. Tenga en cuenta aquí que los valores de entropía deben convertirse en unidades de mol-1 K -1 k-1 durante este paso.
Ahora tenemos las cantidades necesarias para calcular las concentraciones atmosféricas de glicina hidratada como se muestra en el paso 6. Los resultados deben ser similares a los datos que se muestran en la Tabla 4,pero cabe esperar pequeñas diferencias numéricas. La Tabla 4 muestra las concentraciones de hidratos de equilibrio encontradas a partir de la formulación del sistema de seis ecuaciones en el Paso 6.2 en una ecuación de matriz y su solución posterior. Comenzamos reconociendo el hecho de que el sistema de ecuaciones se puede escribir como
donde Kn es la constante de equilibrio para lana hidratación secuencial de glicina, w es la concentración de agua en la atmósfera, g es la concentración inicial de glicina aislada en la atmósfera, y gn es la concentración de equilibrio de Gly(H2O)n. Si reescribimos la ecuación anterior como Ax a b, obtenemos x a A-1b donde A-1 es la inversa de la matriz A. Esto inverso se puede calcular fácilmente utilizando funciones de hoja de cálculo integradas como se muestra en la Tabla 4 para obtener los resultados finales.
La Figura 4 muestra la concentración de equilibrio de glicina hidratada calculada en la Tabla 4 en función de la temperatura a 100% de humedad relativa y 1 presión de la atmósfera. Muestra que, a medida que la temperatura disminuye de 298.15K a 216.65K, la concentración de glicina no hidratada (n-0) disminuye y aumenta la de la glicina hidratada. La glicina dihidrato (n-2) en particular aumenta drásticamente con la disminución de la temperatura, mientras que el cambio en la concentración de otros hidratos es menos notable. Esta correlación inversa entre la temperatura y la concentración de hidratos es consistente con la expectativa de que las energías libres de Gibbs más bajas de hidratación a temperaturas más bajas favorecen la formación de hidratos.
La Figura 5 ilustra la dependencia relativa de humedad de la concentración de equilibrio de hidratos de glicina a 298.15K y 1 presión de atmósfera. Demuestra claramente que a medida que la humedad relativa aumenta del 20% al 100%, la concentración de hidratos (n>0) aumenta a expensas de la glicina no hidratada (n-0). Una vez más la correlación directa entre la humedad relativa y la concentración de hidratos es consistente con la idea de que la presencia de más moléculas de agua en RH más alta promueve la formación de hidratos.
Como se presenta, este protocolo proporciona una comprensión cualitativa de las poblaciones de glicina hidratada en la atmósfera. Suponiendo una concentración inicial de glicina aislada de 2,9 millones de moléculas por centímetro cúbico, vemos que la glicina no hidratada (n-0) es la especie más abundante en la mayoría de las condiciones excepto T-216.65K y RH-100%. El dihidrato (n-2), que tiene la menor energía de hidratación libre de Gibbs secuencial a las tres temperaturas, es el hidrato más abundante en las condiciones consideradas aquí. Se prevé que los hidratos monohidratos (n-1) y los hidratos más grandes (n-3) se encuentren en cantidades insignificantes. Tras la inspección de la Figura 3,la abundancia de los racimos n-1-4 puede estar relacionada con la estabilidad y la tensión en la red de enlaces de hidrógeno de los racimos. Estos cúmulos tienen las moléculas de agua de hidrógeno unidas a la mitad del ácido carboxílico de la glicina en una geometría que se asemeja mucho a las de varias estructuras de anillo sacadas de hidrógeno, haciéndolos especialmente estables.
Figura 1: Descripción esquemática del procedimiento actual. Un gran conjunto de estructuras de conjeturas generadas por el algoritmo genético (GA) se refina mediante una serie de optimizaciones de geometría PW91 hasta que se obtiene un conjunto de estructuras convergentes. Las frecuencias vibratorias de estas estructuras se calculan y se utilizan para calcular la energía libre de formación de Gibbs, que a su vez se utiliza para calcular las concentraciones de equilibrio de los clústeres en condiciones ambientales. Haga clic aquí para ver una versión más grande de esta figura.
Figura 2: Estructura de directorios representativa para cada clúster. Los scripts internos incluidos en este protocolo requieren la estructura de directorios mostrada anteriormente, donde n es el número de moléculas de agua. Para cada n en gly-h2o-n, hay los siguientes subdirectorios: GA para algoritmo genético con un directorio GA/pm7, QM para mecánica cuántica con QM/pw91-sb para PW91/6-31+G*, QM/pw91-lb para PW91/6-311++G** y QM/pw91-lb/ultrafine para optimizaciones y cálculos vibratorios finales en la integración ultra. Haga clic aquí para ver una versión más grande de esta figura.
Figura 3: Estructuras representativas de baja energía de Gly(H2O)n-0-5. Estos cúmulos fueron el mínimo global de energía electrónica optimizado en el nivel de teoría PW91/6-311++G**. Haga clic aquí para ver una versión más grande de esta figura.
Figura 4: Dependencia de la temperatura de Gly(H2O)n-0-5 como 100% de humedad relativa y 1 atm de presión. La concentración de los hidratos se da en unidades de moléculas cm-3. Haga clic aquí para ver una versión más grande de esta figura.
Figura 5: Dependencia relativa de la humedad de Gly(H2O)n-0-5 como 298.15 K y 1 atm de presión. La concentración de los hidratos se da en unidades de moléculas cm-3. Haga clic aquí para ver una versión más grande de esta figura.
E[PW91/6-311++G**] | 216.65 K | 273.15 K | 298.15 K | ||||||||
LB-UF | ZPVE | H -H | S | G | H -H | S | G | H -H | S | G | |
Agua | -76.430500 | 13.04 | 1.72 | 42.59 | 5.54 | 2.17 | 44.44 | 3.08 | 2.37 | 45.14 | 1.96 |
Glicina | -284.434838 | 48.55 | 2.65 | 69.53 | 36.14 | 3.70 | 73.81 | 32.09 | 4.22 | 75.61 | 30.22 |
Tabla 1: Energías monómeros. Las energías electrónicas están en unidades de Hartree mientras que todas las demás cantidades están en unidades de kcal mol-1. El agua y la glicina se optimizaron en el nivel PW91/6-311++G** de teoría y se calcularon las frecuencias vibratorias. Las correcciones termodinámicas para una presión de 1 atm y una temperatura de 298,15 K se calcularon utilizando el script thermo.pl.
E[PW91/6-311++G**] | 0 K | 216.65 K | 273.15 K | 298.15 K | ||||||||
N | Nombre | LB-UF | ZPVE | H -H | S | G | H -H | S | G | H -H | S | G |
1 | gly-h2o-1 | -360.88481 | 63.96 | 3.61 | 80.12 | 50.22 | 5.12 | 86.27 | 45.52 | 5.85 | 88.83 | 43.33 |
2 | gly-h2o-2 | -437.33763 | 79.33 | 4.53 | 90.86 | 64.17 | 6.46 | 98.78 | 58.81 | 7.40 | 102.06 | 56.30 |
3 | gly-h2o-3 | -513.78620 | 94.52 | 5.67 | 105.08 | 77.42 | 8.08 | 114.94 | 71.19 | 9.23 | 119.00 | 68.27 |
4 | glu-h2o-4 | -590.23667 | 109.80 | 6.03 | 104.98 | 91.30 | 8.78 | 116.21 | 84.40 | 10.11 | 120.87 | 81.14 |
5 | gly-h2o-5 | -666.68845 | 125.80 | 7.26 | 121.70 | 106.69 | 10.47 | 134.83 | 99.44 | 12.01 | 140.24 | 96.00 |
Tabla 2: Energías de racimo. Las energías de las estructuras Gly(H2O)n-1-5 de menor energía encontradas utilizando nuestro procedimiento descrito en la Figura 1. Las energías electrónicas están en unidades de Hartree mientras que todas las demás cantidades están en unidades de kcal mol-1.
Hidratación total: Gly + nH2O <-> Gly(H2O)n | Hidratación secuencial: Gly(H2O)n-1 + H2O <-> Gly(H2O)n | ||||||||||||||||
E[PW91/6-311++G**] | 216.65 | 273.15 | 298.15 | 216.65 | 273.15 | 298.15 | |||||||||||
N | nombre del sistema | LB-UF | E(0) | H (T) | G (T) | H (T) | G (T) | H (T) | G (T) | LB-UF | E(0) | H (T) | G (T) | H(T) | G (T) | H (T) | G (T) |
1 | gly-h2o-1 | -12.22 | -9.85 | -10.61 | -3.68 | -10.61 | -1.87 | -10.59 | -1.07 | -12.22 | -9.85 | -10.61 | -3.68 | -10.61 | -1.87 | -10.59 | -1.07 |
2 | gly-h2o-2 | -26.22 | -21.53 | -23.10 | -9.27 | -23.11 | -5.66 | -23.09 | -4.06 | -14.00 | -11.68 | -12.49 | -5.59 | -12.50 | -3.79 | -12.50 | -2.99 |
3 | gly-h2o-3 | -37.56 | -30.72 | -32.88 | -12.90 | -32.87 | -7.69 | -32.82 | -5.38 | -11.34 | -9.19 | -9.78 | -3.63 | -9.76 | -2.03 | -9.73 | -1.32 |
4 | glu-h2o-4 | -50.10 | -40.34 | -43.48 | -15.87 | -43.54 | -8.71 | -43.51 | -5.55 | -12.54 | -9.62 | -10.60 | -2.97 | -10.67 | -1.02 | -10.69 | -0.17 |
5 | gly-h2o-5 | -63.45 | -51.41 | -55.42 | -20.58 | -55.51 | -11.48 | -55.48 | -7.45 | -13.35 | -11.07 | -11.94 | -4.71 | -11.97 | -2.77 | -11.97 | -1.90 |
Tabla 3: Energías hidratantes. La energía total de hidratación y energía de hidratación secuencial para Gly(H2O)n-1-5 en unidades de kcal mol-1. Aquí, E[PW91/6-311++G**] es el cambio en la energía electrónica, e(0) es el cambio de energía vibratoria de punto cero (ZPVE) corregido en la energía, H (T) es el cambio de entalpía a la temperatura T, y g(T) es el cambio de energía libre de Gibbs de hidratación de cada gly(H2O)n-1-5 cluster.
Distribución de hidratos de equilibrio en función de la temperatura y la humedad relativa | |||||||||
T-298.15K | T-273.15K | T-216.65K | |||||||
Gly(H2O)n | RH-100% | RH-50% | RH-20% | RH-100% | RH-50% | RH-20% | RH-100% | RH-50% | RH-20% |
0 | 1.3E+06 | 2.2E+06 | 2.7E+06 | 1.1E+06 | 2.0E+06 | 2.7E+06 | 6.1E+05 | 1.5E+06 | 2.5E+06 |
1 | 2.3E+05 | 1.9E+05 | 9.5E+04 | 2.0E+05 | 1.9E+05 | 9.9E+04 | 1.2E+05 | 1.5E+05 | 9.5E+04 |
2 | 1.0E+06 | 4.3E+05 | 8.4E+04 | 1.3E+06 | 6.1E+05 | 1.3E+05 | 1.8E+06 | 1.1E+06 | 3.0E+05 |
3 | 2.8E+05 | 5.8E+04 | 4.5E+03 | 3.2E+05 | 7.4E+04 | 6.3E+03 | 3.1E+05 | 9.6E+04 | 1.0E+04 |
4 | 1.1E+04 | 1.1E+03 | 3.4E+01 | 1.3E+04 | 1.5E+03 | 5.0E+01 | 1.1E+04 | 1.8E+03 | 7.5E+01 |
5 | 7.5E+03 | 3.9E+02 | 4.9E+00 | 1.2E+04 | 7.2E+02 | 9.7E+00 | 2.4E+04 | 1.9E+03 | 3.1E+01 |
Tabla 4: Concentraciones de hidratos de equilibrio de Gly(H2O)n-0-5 como temperatura de funcionamiento (T-298.15K, 273.15K, 216.65K) y humedad relativa (RH-100%, 50%, 20%). La concentración de los hidratos se da en unidades de moléculas cm-3 asumiendo valores experimentales56,57,58, de [Gly]0 a 2,9 x 106 cm-3 y [H2O] a 7,7 x 1017 cm-3, 1,6 x 1017 cm-3 y 9,9 x 1014 cm-3 a 100% de humedad relativa y T a 298,15 K, 273.15 K y 216.65 K, respectivamente59.
Archivos suplementarios. Haga clic aquí para descargar estos archivos.
La exactitud de los datos generados por este protocolo depende principalmente de tres cosas: (i) la variedad de configuraciones muestreadas por el Paso 2, (ii) la exactitud de la estructura electrónica del sistema, (iii) y la exactitud de las correcciones termodinámicas. Cada uno de estos factores se puede abordar modificando el método editando los scripts incluidos. El primer factor se supera fácilmente con el uso de un grupo inicial más grande de estructuras generadas aleatoriamente, más numerosas iteraciones de la GA y una definición más flexible de los criterios involucrados en el GA. Además, se puede utilizar un método semiempírico diferente, como el modelo autoconsistente de enlace estrecho funcional de densidad de carga (SCC-DFTB)y el modelo eficaz de potencial de fragmentos (EFP)63 para explorar los efectos de diferentes descripciones físicas. La principal limitación aquí es la incapacidad del método para formar o romper enlaces covalentes, lo que significa que los monómeros están congelados. El procedimiento GA sólo encuentra las posiciones relativas más estables de estos monómeros congelados de acuerdo con la descripción semiempírica.
La precisión de la estructura electrónica del sistema se puede mejorar de diversas maneras, cada una con su costo computacional. Uno puede elegir una mejor densidad funcional, como M06-2X64 y wB97X-V65,o el método mecánico cuántico (QM), como el método de perturbación de m-ller-Plesset66,67,68 (MPn) y los métodos acoplados69 (CC) para mejorar la descripción física del sistema. En la jerarquía de las funciones funcionales, el rendimiento generalmente mejora al pasar de las funciones de aproximación de gradiente generalizado (GGA) como PW91 a las funciones híbridas separadas por rango como las funciones híbridas wB97X-D y meta-GGA como M06-2X.
La desventaja de los métodos DFT es que no es posible una convergencia sistemática hacia un valor preciso; sin embargo, los métodos DFT son computacionalmente baratos y hay una amplia variedad de funciones para una amplia variedad de aplicaciones.
Energías calculadas utilizando métodos de función de onda como MP2 y CCSD(T) junto con conjuntos de base consistentes de correlación de número cardinal creciente ([aug-]cc-pV[D,T,Q,...] Z) convergen hacia su límite de conjunto de base completo sistemáticamente, pero el costo computacional de cada cálculo se vuelve prohibitivo a medida que crece el tamaño del sistema. El perfeccionamiento adicional de la estructura electrónica se puede lograr mediante el uso de conjuntos de base explícitamente correlacionados70 y extrapolando al límite71 del conjunto de bases completos (CBS). Nuestro trabajo reciente sugiere que un enfoque perturbador de segundo orden de segundo orden (DF-MP2-F12) explícitamente correlacionado con la densidad produce energías que se acercan a la de los cálculos MP2/CBS32. La modificación del protocolo actual para utilizar diferentes métodos de estructura electrónica implica dos pasos: (i) preparar un archivo de entrada de plantilla siguiendo la sintaxis dada por el software, (ii) y editar los scripts run-pw91-sb.csh, run-pw91-lb.cshy run-pw91-lb-ultrafine.csh para generar la sintaxis correcta del archivo de entrada, así como el script de envío correcto para el software.
Por último, la precisión de las correcciones termodinámicas depende del método de estructura electrónica, así como de la descripción del PES en torno al mínimo global. Una descripción precisa del PES requiere el cálculo de derivados de tercer y mayor orden del PES con respecto a los desplazamientos en los grados nucleares de libertad, como el campo de fuerza cuartica72,73 (QFF), que es una tarea excepcionalmente costosa. El protocolo actual utiliza la aproximación del oscilador armónico a las frecuencias vibratorias, lo que resulta en la necesidad de calcular sólo hasta un segundo derivados del PES. Este enfoque se vuelve problemático en sistemas con alta anarmónica, tales como moléculas muy flácidas y potenciales simétricos de doble pocación debido a la gran diferencia en el verdadero PES y el PES armónico. Además, el costo de tener un PES de alta calidad a partir de un método de estructura electrónica computacionalmente exigente sólo agrava el problema del costo para los cálculos de frecuencia de vibración. Un enfoque para superar esto es utilizar las energías electrónicas de un cálculo de estructura electrónica de alta calidad junto con frecuencias vibratorias calculadas en un PES de menor calidad, lo que resulta en un equilibrio entre costo y precisión. El protocolo actual se puede modificar para utilizar diferentes descripciones PES como se describe en el párrafo anterior; sin embargo, también se pueden editar las palabras clave de frecuencia vibratoria en los scripts y plantillas para calcular las frecuencias vibratorias anarmáticas.
Dos problemas cruciales para cualquier protocolo de muestreo de configuración son el método inicial para muestrear la superficie de energía potencial y los criterios utilizados para identificar cada clúster. Hemos hecho un uso extensivo de una variedad de métodos en nuestro trabajo anterior. Para el primer número, el método inicial para el muestreo de la superficie de energía potencial, hemos tomado la decisión de utilizar GA con métodos semiempíricos basados en estos factores. El muestreo configurational utilizando la intuición química26, muestreo aleatorio, y dinámica molecular (MD)29,30, no encuentra minima global putativo regularmente para racimos de más de 10 monómeros, como observamos en nuestros estudios de cúmulos de agua18. Hemos utilizado con éxito el salto de cuenca (BH) para estudiar el complejo PES de (H2O)1174, pero requería la inclusión manual de algunos isómeros potenciales de baja energía que el algoritmo BH no encontró. Una comparación del desempeño de BH y GA en la búsqueda del mínimo global de los cúmulos de agua, (H2O)n-10-20 demostró que GA constantemente encontró el mínimo global más rápido que BH75. GA como se implementa en OGOLEM y CLUSTER es muy versátil porque se puede aplicar a cualquier clúster molecular y puede interactuar con un gran número de paquetes con campo de fuerza clásico, semiempírica, densidad funcional y capacidades ab initio. La elección de PM7 es impulsada por su velocidad y precisión razonable. Prácticamente cualquier otro método semiempírico tendría un costo computacional significativamente mayor.
En cuanto al segundo número, hemos explorado el uso de diferentes criterios para identificar estructuras únicas que van desde energías electrónicas, momentos de dipolo, RMSD superpuestas y constantes de rotación. El uso de momentos dipolo resultó difícil porque ambos componentes del momento del dipolo dependían de la orientación de la molécula y el momento total del dipolo era muy sensible a las diferencias de geometría de tal manera que era difícil establecer umbrales determinando que las estructuras son las mismas o únicas. Una combinación de energías electrónicas y constantes de rotación resultó ser más útil.
Los criterios actuales para considerar dos estructuras únicas se basan en un umbral de diferencia de energía de 0,10 kcal mol-1 y una diferencia constante rotacional del 1%. Por lo tanto, dos estructuras se consideran diferentes si sus energías difieren en más de 0,10 kcal mol-1 (0,00015 a.u.) Y cualquiera de sus tres constantes de rotación (A, B, C) difieren en más de 1%. Los puntos de referencia internos sustanciales a lo largo de los años constataron que estos umbrales eran opciones razonables. Nuestro enfoque de muestreo de configuración y metodología de cribado se ha aplicado a racimos muy débilmente unidos, como hidrocarburos poliaromáticos complejos con agua76,,77, así como hidratos de sulfato ternario fuertemente unidos que contienen amoníaco y aminas32. Para los cúmulos donde hay diferentes estados de protonación a tener en cuenta, el mejor enfoque es ejecutar varios cálculos de GA, cada uno comenzando con monómeros en diferentes estados de protonación. Esto garantiza que las estructuras con diferentes estados de protonación se consideran cuidadosamente. Sin embargo, los cálculos DFT de bajo nivel a menudo permiten que los estados de protonación cambien durante el transcurso de la optimización de la geometría, lo que produce el estado de protonación más estable independientemente de la geometría inicial.
Nuestros métodos de muestreo de configuración de GA deben funcionar bien incluso para moléculas de disquete, siempre y cuando los códigos GA estén intercomunicados con métodos generales no parametrizados que permitan a los monómeros adoptar diferentes configuraciones durante el transcurso de la ejecución de GA. Por ejemplo, la interconexión de GA con PM7 permitiría que las estructuras de los monómeros cambien, pero si sus lazos se rompen como sucedería cuando cambian los estados de protonación, las estructuras pueden descartarse como candidatos inaceptables.
Hemos considerado diferentes formas de corregir las deficiencias de la aproximación armónica, especialmente las derivadas de frecuencias vibratorias bajas. Incorporar la aproximación cuasi-armónica en la metodología actual no es difícil. Sin embargo, todavía hay preguntas sobre el método cuasi armónico, especialmente cuando se trata de la frecuencia de corte por debajo de la cual se aplicará. Además, no hay trabajos de benchmarking rigurosos que examinen la fiabilidad de la aproximación cuasi-RRHO a pesar de que la sabiduría convencional sugiere que debería ser una mejora con respecto a la aproximación de RRHO.
El protocolo así presentado puede generalizarse en cualquier sistema de cúmulos moleculares de fase de gas no ligados a la cocovalente. También se puede generalizar para utilizar cualquier método semiempírico, método de estructura electrónica y software, y método de análisis de vibración y software mediante la edición de los scripts y plantillas. Esto supone que el usuario se siente cómodo con la interfaz de línea de comandos de Linux, secuencias de comandos de Python y la informática de alto rendimiento. La sintaxis desconocida y el aspecto del sistema operativo Linux y la falta de experiencia en scripting es el mayor escollo en este protocolo y es donde los nuevos estudiantes más luchan. Este protocolo se ha utilizado con éxito en una variedad de implementaciones durante años en nuestro grupo, centrándose principalmente en los efectos del ácido sulfúrico y el amoníaco en la formación de aerosoles. Otras mejoras en este protocolo implicarán una interfaz más robusta para un software de estructura más electrónica, implementaciones alternativas del algoritmo genético y posiblemente el uso de métodos más nuevos para cálculos más rápidos de energías electrónicas y vibratorias. Nuestras aplicaciones actuales de este protocolo están explorando la importancia de los aminoácidos en las primeras etapas de la formación de aerosoles en la atmósfera actual y en la formación de moléculas biológicas más grandes en entornos prebióticos.
Ninguno.
Este proyecto fue apoyado por las subvenciones CHE-1229354, CHE-1662030, CHE-1721511 y CHE-1903871 de la National Science Foundation (GCS), el Arnold and Mabel Beckman Foundation Beckman Scholar Award (AGG) y la Barry M. Goldwater Scholarship (AGG). Se utilizaron recursos informáticos de alto rendimiento del Consorcio MERCURY (http://www.mercuryconsortium.org).
Name | Company | Catalog Number | Comments |
Avogadro | https://avogadro.cc | Open-source molecular visualization program | |
Gaussian [09/16] Software | http://www.gaussian.com/ | Commercial ab initio electronic structure program | |
MOPAC 2016 | http://openmopac.net/MOPAC2016.html | Open-source semi-empirical program | |
OGOLEM Software | https://www.ogolem.org | Genetic algorithm-based global optimization program | |
OpenBabel | http://openbabel.org/wiki/Main_Page | Open-source cheminformatics library | |
calcRotConsts.py | Shields Group, Department of Chemistry, Furman University | Python script to compute rotational constants | |
calcSymmetry.csh | Shields Group, Department of Chemistry, Furman University | Shell script to calculate symmetry number of a molecule given Cartesian coordinates | |
combine-GA.csh | Shields Group, Department of Chemistry, Furman University | Shell script to combine energy and rotational constants from different GA directories | |
combine-QM.csh | Shields Group, Department of Chemistry, Furman University | Shell script to combine energy and rotational constants from different QM directories | |
gaussianE.csh | Shields Group, Department of Chemistry, Furman University | Shell script to extract Gaussian 09 energies | |
gaussianFreqs.csh | Shields Group, Department of Chemistry, Furman University | Shell script to extract Gaussian 09 vibrational frequencies | |
getrotconsts | Shields Group, Department of Chemistry, Furman University | Executable to calculate rotational constants given a molecule's Cartesian coordinates | |
getRotConsts-dft-lb.csh | Shields Group, Department of Chemistry, Furman University | Shell script to compute rotational constants for a batch of large basis DFT optimized structures | |
getRotConsts-dft-lb-ultrafine.csh | Shields Group, Department of Chemistry, Furman University | Shell script to compute rotational constants for a batch of ultrafine DFT optimized structures | |
getRotConsts-dft-sb.csh | Shields Group, Department of Chemistry, Furman University | Shell script to compute rotational constants for a batch of small basis DFT optimized structures | |
getRotConsts-GA.csh | Shields Group, Department of Chemistry, Furman University | Shell script to compute rotational constants for a batch of genetic algorithm optimized structures | |
global-minimum-coords.xyz | Shields Group, Department of Chemistry, Furman University | Cartesian coordinates of global minimum structures of gly-(h2o)n, where n=0-5 | |
make-thermo-gaussian.csh | Shields Group, Department of Chemistry, Furman University | Shell script to extract data from Gaussian output files and make input files for the thermo.pl script | |
ogolem-input-file.ogo | Shields Group, Department of Chemistry, Furman University | Ogolem sample input file | |
ogolem-submit-script.pbs | Shields Group, Department of Chemistry, Furman University | PBS batch submission file for Ogolem calculations | |
README.docx | Shields Group, Department of Chemistry, Furman University | Clarifications to help readers use the scripts effectively | |
runogolem.csh | Shields Group, Department of Chemistry, Furman University | Shell script to run OGOLEM | |
run-pw91-lb.csh | Shields Group, Department of Chemistry, Furman University | Shell script to run a batch of large basis DFT optimization calculations | |
run-pw91-lb-ultrafine.csh | Shields Group, Department of Chemistry, Furman University | Shell script to run a batch of ultrafine DFT optimization calculations | |
run-pw91-sb.csh | Shields Group, Department of Chemistry, Furman University | Shell script to run a batch of small basis DFT optimization calculations | |
run-thermo-pw91.csh | Shields Group, Department of Chemistry, Furman University | Shell script to compute the thermodynamic corrections for a batch of DFT optimized structures | |
similarityAnalysis.py | Shields Group, Department of Chemistry, Furman University | Python script to determine unique structures based on rotational constants and energies | |
symmetry | Shields Group, Department of Chemistry, Furman University | Executable to calculate molecular symmetry given Cartesian coordinates | |
symmetry.c | (C) 1996, 2003 S. Patchkovskii, Serguei.Patchkovskii@sympatico.ca | C code to determine the molecular symmstry of a molecule given Cartesian coordinates | |
template-marcy.pbs | Shields Group, Department of Chemistry, Furman University | Template for a PBS submit script which uses OGOLEM | |
template-pw91.com | Shields Group, Department of Chemistry, Furman University | Template Gaussian 09 input | |
template-pw91-HL.com | Shields Group, Department of Chemistry, Furman University | Template Gaussian 09 input for ultrafine DFT optimization | |
thermo.pl | https://www.nist.gov/mml/csd/chemical-informatics-research-group/products-and-services/program-computing-ideal-gas | Perl open-source script to compute ideal gas thermodynamic corrections | |
gly-h2o-n.xlsx | Shields Group, Department of Chemistry, Furman University | Excel spreadsheet for the complete protocol | |
table-1.xlsx | Shields Group, Department of Chemistry, Furman University | Excel spreadsheet | |
table-2.xlsx | Shields Group, Department of Chemistry, Furman University | Excel spreadsheet | |
table-3.xlsx | Shields Group, Department of Chemistry, Furman University | Excel spreadsheet | |
table-4.xlsx | Shields Group, Department of Chemistry, Furman University | Excel spreadsheet | |
water.xyz | Shields Group, Department of Chemistry, Furman University | Cartesian coordinates of water | |
glycine.xyz | Shields Group, Department of Chemistry, Furman University | Cartesian coordinates of glycine |
Solicitar permiso para reutilizar el texto o las figuras de este JoVE artículos
Solicitar permisoThis article has been published
Video Coming Soon
ACERCA DE JoVE
Copyright © 2025 MyJoVE Corporation. Todos los derechos reservados