Este artículo proporciona un flujo de trabajo para que los científicos construyan una tabla de diseño experimental y analicen los resultados experimentales sobre una variedad de factores de mezcla y proceso, sin requerir decisiones estadísticas tediosas y potencialmente volátiles. Los modelos resultantes pueden optimizarse conjuntamente en múltiples respuestas y utilizarse para producir gráficos informativos para resumir tanto la superficie de respuesta conjunta como las predicciones de las respuestas individuales. Estos gráficos son más fáciles de interpretar que las estimaciones de parámetros de los modelos estadísticos subyacentes y son útiles para representar la configuración de factores que producen las respuestas más deseables.
Los científicos de formulación de lípidos y nanopartículas con frecuencia necesitan construir nuevas recetas para diferentes cargas útiles o al cambiar los lípidos o la configuración del proceso. Proporcionamos un enfoque sólido para la optimización de la formulación que minimiza el potencial de error en la construcción del diseño y evita la necesidad de una amplia estadística y conocimiento durante el análisis. Resuma el propósito del experimento en un documento con fecha marcada.
Enumere las respuestas que se medirán durante el experimento. Seleccione los factores que serán variados y los que se mantendrán constantes durante el estudio. Establezca los rangos para los factores variables y la precisión decimal relevante para cada uno.
Decida el tamaño del diseño del estudio utilizando la heurística mínima y máxima. Abra el salto y navegue por la barra de menú hasta DOI, Propósito especial, Diseño de relleno de espacio. Introduzca las respuestas del estudio.
Introduzca los factores de estudio y los rangos. Introduzca el número predeterminado de ejecuciones para el diseño. Genere la tabla de diseño de relleno de espacio para los factores elegidos y el tamaño de ejecución.
Agregue una columna de notas a la tabla para anotar cualquier ejecución creada manualmente. Si procede, incorpore manualmente ejecuciones de control de referencia en la tabla de diseño. Incluya una réplica para uno de los puntos de referencia controlados.
Marque el nombre del punto de referencia en la columna de notas y codifique con color las filas de replicación del punto de referencia para una fácil identificación correcta. Redondee la mezcla de niveles de factor a la granularidad adecuada. Copie los valores redondeados y péguelos en las columnas originales.
Elimine las copias redundantes de las columnas redondeadas. Después de redondear los factores lipídicos, verifique que su suma sea igual al 100%Si la suma de las filas no es igual a una, ajuste manualmente uno de los factores de mezcla, asegurándose de que se mantenga dentro del rango de factores. Elimine la columna de suma después de realizar los ajustes.
Siga el mismo procedimiento utilizado para redondear los factores de mezcla para redondear los factores de proceso a su respectiva granularidad. Dé formato a las columnas de lípidos para que aparezcan como porcentajes con el número deseado de decimales. Si ha agregado ejecuciones manuales, como puntos de referencia, vuelva a aleatorizar el orden de las filas de la tabla y agregue una nueva columna con valores redondeados.
Ordene esta columna en orden ascendente haciendo clic con el botón secundario en su encabezado de columna y, a continuación, elimine la columna. Generar gráficos ternarios para visualizar los puntos de diseño sobre los factores lipídicos. Examine también la distribución de ejecución sobre los factores de proceso.
Los científicos de formulación deben confirmar la viabilidad de todas las corridas. Si existen ejecuciones inviables, reinicie el diseño teniendo en cuenta las restricciones recién descubiertas. Ejecute el experimento en el orden proporcionado por la tabla de diseño.
Registre las lecturas en la columna integrada en la tabla experimental. Trazar las lecturas y examinar las distribuciones de las respuestas. Examine la distancia relativa entre las ejecuciones de réplicas codificadas por colores si se incluyó una, esto permite la comprensión del proceso total y la variación analítica en el punto de referencia, en comparación con la variabilidad debida a los cambios en la configuración de factores en todo el espacio factorial.
Elabora las carreras en parcelas ternarias. Colorea los puntos de acuerdo con las respuestas para obtener una vista independiente del modelo del comportamiento sobre los factores de mezcla. Haga clic derecho en cualquiera de los gráficos resultantes, seleccione Leyenda de fila y luego seleccione la columna de respuesta.
Repita esto para cada respuesta. Construir un modelo independiente para cada respuesta en función de los factores de estudio. Elimine los scripts de modelo creados por el diseño de relleno de espacios.
Seleccione Analizar, Ajustar modelo. Construir un modelo completo que comprenda todos los efectos candidatos. Este modelo debe incluir los principales efectos de cada factor, interacciones de dos y tres vías, términos cúbicos cuadráticos y parciales en los factores de proceso y términos cúbicos de Scheffe para los factores de mezcla.
Seleccione todos los factores del estudio. Cambie la entrada de grado a tres desde el valor predeterminado de dos. Luego seleccione un Factorial a Grado.
Seleccione sólo los factores que no son de mezcla y, a continuación, seleccione Macros, Cúbico parcial. Seleccione solo los factores de mezcla y, a continuación, seleccione Macros, Scheffe Cubic. Desactive la opción predeterminada sin intercepción.
Especifique la columna de respuesta, cambie la Personalidad a Regresión generalizada. Guarde este modelo configurado en la tabla de datos para recuperarlo fácilmente. Seleccione Guardar en tabla de datos.
Haga clic en Ejecutar. Para el método de estimación, seleccione SVEM Forward Selection (Selección de reenvío SVEM). Expanda los menús Controles avanzados Forzar términos y desmarque las casillas correspondientes a los efectos principales de la mezcla.
Solo el término de Interceptación permanecerá marcado. Haga clic en Ir.Trazar las respuestas reales por sus respuestas predichas del modelo SVEM para verificar una previsibilidad razonable. Haga clic en el triángulo rojo junto a SVEM Forward Selection (Selección de avance de SVEM) y seleccione Save Columns (Guardar columnas), Save Prediction Formula (Guardar fórmula).
Esto crea una nueva columna que contiene la fórmula de predicción en la tabla de datos Repita los pasos de creación del modelo para cada respuesta. Después de que todas las respuestas tengan columnas de predicción guardadas en la tabla de datos, trace los seguimientos de respuesta para todas las columnas de respuesta predichas mediante una función de generador de perfiles. Seleccione Generador de perfiles de gráficos y seleccione todas las columnas de predicción creadas en el paso anterior para la fórmula de predicción Y, haga clic en Aceptar.
Identificar formulaciones óptimas candidatas. Establezca la función de conveniencia para cada respuesta, ya sea que deba maximizarse, minimizarse o coincidir con un objetivo. Esto también implica establecer los pesos de importancia relativa para cada respuesta.
Para generar el primer candidato, establezca cualquier respuesta primaria para usar el peso de importancia 1.0 y cualquier respuesta secundaria para usar el peso de importancia 0.2. Indique al generador de perfiles que encuentre la configuración de factores óptima que maximice la función de deseabilidad. Seleccione Optimización Deseabilidad, Maximizar deseabilidad.
Registre la configuración óptima de factores junto con una nota sobre las ponderaciones de importancia utilizadas para cada respuesta. Para factores categóricos como el tipo de lípido ionizable, encuentre las formulaciones condicionalmente óptimas para cada nivel de factor. Primero, establezca el nivel deseado de cada factor en el perfilador.
Luego mantenga presionada la tecla de control y haga clic izquierdo dentro del gráfico de ese factor y seleccione Configuración del factor de bloqueo. Esta optimización y conveniencia seleccionadas, maximizan la conveniencia de encontrar el óptimo condicional con este factor bloqueado en su configuración actual. Cuando haya terminado, desbloquee la configuración de factores antes de continuar.
Repita el proceso de optimización después de modificar los pesos de importancia de la respuesta, tal vez solo optimizando las respuestas primarias o configurando algunas de las respuestas secundarias para que tengan un peso más o menos importante, estableciendo así su objetivo en ninguno. Registre el nuevo candidato óptimo. Producir resúmenes gráficos de las regiones óptimas del espacio factorial.
Cree una tabla de datos que contenga 50.000 filas que se rellenan con ajustes de factores generados aleatoriamente dentro del espacio de factores permitido, junto con los valores previstos correspondientes de los modelos reducidos para cada una de las respuestas, así como la función de deseabilidad conjunta. Seleccione Tabla aleatoria de salida. Cambie el valor de cuántas ejecuciones desea simular a 50, 000 y haga clic en Aceptar.
En la tabla recién creada, agregue una nueva columna que calcule el percentil de la columna de deseabilidad. Utilice esta columna de percentiles en los gráficos ternarios en lugar de la columna de deseabilidad sin procesar. Haga clic con el botón derecho en el encabezado de la columna Deseabilidad y seleccione Nueva columna de fórmula, Distribución, Probabilidad acumulativa.
Genere los siguientes gráficos. Modifique repetidamente el esquema de color de los gráficos para mostrar las predicciones para cada respuesta y para la columna de probabilidad acumulativa. Construir gráficos ternarios para los cuatro factores lipídicos.
En la tabla, desplácese hasta el gráfico ternario. Seleccione los factores de mezcla para el trazado X y haga clic en Aceptar. Haga clic con el botón derecho en uno de los gráficos resultantes, seleccione Leyenda de fila y, a continuación, seleccione la columna de respuesta prevista.
Cambie el menú desplegable de colores a Jet. Esto mostrará las regiones de mejor y peor desempeño con respecto a los factores lipídicos. La figura actual muestra los percentiles de la conveniencia conjunta al considerar maximizar la potencia con una secuela importante de 1, y minimizar el tamaño con una secuela importante de 0.2.
Mientras promedia sobre cualquier factor que no se muestre en el eje de la gráfica ternaria. Cambie repetidamente el esquema de color de los gráficos para mostrar las predicciones de cada respuesta. Del mismo modo, trace los 50, 000 puntos codificados por colores que representan formulaciones únicas contra los factores de proceso sin mezcla, ya sea singular o conjuntamente, y busque relaciones entre las respuestas y los factores.
Busque la configuración de factores que producen el rendimiento de puntos en la mayor conveniencia. Esta figura muestra la conveniencia conjunta de todas las formulaciones que podrían formarse con cada uno de los tres tipos de lípidos ionizados. Las formulaciones más deseables utilizan H102, con H101 proporcionando algunas alternativas potencialmente competitivas.
Explore diferentes combinaciones de factores que podrían conducir a diferentes respuestas. Guarde el generador de perfiles de predicción y su configuración recordada en la tabla de datos. Prepare una tabla que enumere los candidatos óptimos identificados anteriormente.
Incluya el control de referencia con el conjunto de ejecuciones candidatas que se formularán y medirán. Si se encontró que alguna de las formulaciones del experimento produce resultados deseables, tal vez superando el punto de referencia, seleccione la mejor para agregar a la tabla de candidatos y vuelva a probar junto con nuevas formulaciones. Haga clic derecho en la tabla de configuración recordada en el generador de perfiles y seleccione Convertir en tabla de datos.
Llevar a cabo las ejecuciones de confirmación, construir las formulaciones y reunir las lecturas. Comparar el rendimiento de las formulaciones óptimas candidatas. El flujo de trabajo se ha utilizado en muchas aplicaciones.
En la mayoría de los casos, hemos observado al menos una mejora de cuatro a cinco veces en la potencia cuando comparamos con formulaciones de referencia que se han establecido utilizando una optimización de factor a la vez. Las mejoras son especialmente notables cuando las respuestas secundarias se dirigen conjuntamente. También es posible utilizar la simulación para mostrar la calidad esperada de los candidatos óptimos producidos por este procedimiento.
Utilizando una función de generación de datos conocida para el experimento de ejemplo descrito en el documento, podemos comparar la calidad de las formulaciones óptimas candidatas obtenidas de los diseños de llenado de espacios y el análisis basado en SVEM utilizados en este flujo de trabajo con las obtenidas de las técnicas tradicionales de análisis de mezclas. Con la calidad de la formulación óptima mostrada en el eje vertical y el número de ejecuciones en el diseño que se muestra en el eje horizontal, los puntos azules representan el rendimiento del modelo estadístico completo no reducido en más de 150 simulaciones. Los puntos ámbar representan el rendimiento de la selección tradicional de un solo tiro hacia adelante basada en la función de objetivo AICC.
Los puntos verdes representan el rendimiento del enfoque de selección directa basado en SVEM utilizado en este flujo de trabajo. El análisis SVEM nos permite obtener mejores candidatos óptimos y menos corridas. Habrá estudios ocasionales con complejidad adicional que requieren la ayuda de un estadístico para el diseño y análisis.
Los estudios que son de prioridad extremadamente alta, donde el tamaño de la ejecución es más limitado de lo habitual, o hay un gran número de factores categóricos, o un solo factor categórico con un gran número de niveles pueden ser abordados de manera diferente por un estadístico. Usar diseños óptimos o híbridos en lugar del diseño de relleno de espacio especificado en el flujo de trabajo.