本文为科学家提供了一个工作流程,用于构建实验设计表并分析各种混合物和工艺因素的实验结果,而无需繁琐且可能不稳定的统计决策。生成的模型可以在多个响应上联合优化,并用于生成信息图形,以汇总联合响应面和单个响应的预测。这些图形比基础统计模型中的参数估计值更易于解释,并且有助于表示产生最理想响应的因子设置。
脂质和纳米颗粒配方科学家经常需要为不同的有效载荷或在改变脂质或工艺设置时构建新的配方。我们提供稳健的配方优化方法,最大限度地减少设计结构中出错的可能性,并避免在分析过程中需要广泛的统计和知识。在带日期戳的文档中总结实验的目的。
列出将在实验期间测量的响应。选择将在研究期间变化的因子和保持不变的因子。建立不同因子的范围以及每个因子的相关小数精度。
使用最小和最大启发式方法确定研究设计规模。打开跳转并导航到菜单栏到 DOI、特殊用途、空间填充设计。输入研究响应。
输入研究因子和范围。输入设计的预定运行次数。为所选因子和运行大小生成空间填充设计表。
向表中添加注释列,用于注释任何手动创建的运行。如果适用,请手动将基准控制运行合并到系列零件设计表中。包括其中一个受控基准的复制。
在注释列中标记基准名称,并对基准复制行进行颜色编码,以便于正确识别。将因子水平的混合舍入到适当的粒度。复制舍入值并将其粘贴到原始列中。
删除圆角列的冗余副本。对脂质因子进行舍入后,验证其总和等于 100%如果任何行总和不等于 1,请手动调整其中一个混合因子,确保其保持在因子范围内。完成调整后删除总和列。
按照用于对混合因子舍入的相同过程,将过程因子舍入到其各自的粒度。格式化脂质列,使其显示为具有所需小数位数的百分比。如果添加了基准等手动运行,请重新随机化表行顺序,添加具有舍入值的新列。
通过右键单击其列标题,按升序对此列进行排序,然后删除该列。生成三元图以可视化脂质因子的设计点。还要检查过程因子的运行分布。
配方科学家应确认所有运行的可行性。如果存在不可行的运行,请考虑新发现的约束,重新启动设计。按系列零件设计表提供的顺序运行试验。
将读数记录在实验表中内置的列中。绘制读数并检查响应的分布。检查颜色编码仿行(如果包括一个)之间的相对距离,这样可以了解基准处的总过程和分析变异,与由于整个因子空间中因子设置的变化而导致的变异性相比。
在三元图上制作运行。根据响应为点着色,以获得混合因子行为的模型独立视图。右键单击任何生成的图形,选择"行图例",然后选择响应列。
对每个响应重复此操作。为每个响应构建一个独立的模型作为研究因子的函数。删除由空间填充设计创建的模型脚本。
选择分析,拟合模型。构建包含所有候选效应的完整模型。该模型应包括每个因子的主效应、双向和三向相互作用、过程因子中的二次和偏立方项以及混合因子的舍夫立方项。
选择所有研究因子。将度数条目从默认值 2 更改为 3。然后选择阶乘到度数。
仅选择非混合因子,然后选择宏、部分立方。仅选择混合因子,然后选择宏、舍夫立方体。禁用默认的无拦截选项。
指定响应列,将个性更改为广义回归。将此模型设置保存到数据表中,以便于调用。选择保存到数据表。
单击运行。对于估计方法,请选择 SVEM 前向选择。展开高级控制强制项菜单,然后取消选中与混音主效果对应的框。
只有拦截术语将保持选中状态。单击 Go.按来自 SVEM 模型的预测响应绘制实际响应,以验证合理的可预测性。单击"SVEM 正向选择"旁边的红色三角形,然后选择"保存列"、"保存预测公式"。
这将创建一个新列,其中包含数据表中的预测公式 对每个响应重复模型构建步骤。在所有响应都将预测列保存到数据表后,使用探查器函数绘制所有预测响应列的响应跟踪。选择"图形探查器",然后选择在上一步中为 Y 预测公式创建的所有预测列,单击"确定"。
确定候选的最佳配方。为每个响应设置合意性函数,是应最大化、最小化还是与目标匹配。这还需要为每个响应设置相对重要性权重。
要生成第一个候选项,请将任何主要响应设置为使用重要性权重 1.0,并将任何辅助响应设置为使用重要性权重 0.2。指示探查器查找最大化合意函数的最佳因子设置。选择优化合意性,最大化合意性。
记录最佳因子设置以及有关每个响应使用的重要性权重的说明。对于可电离脂质类型等分类因子,请找到每个因子水平的条件最佳配方。首先,在探查器中设置每个因子的所需水平。
然后按住控制键并在该因子的图形内单击鼠标左键并选择锁定因子设置。这种选择优化和合意性,最大化合意性,以找到条件最优,并将该因子锁定在其当前设置中。完成后,在继续之前解锁因子设置。
在修改响应的重要性权重后重复优化过程,可能只优化主要响应或将某些次要响应设置为具有或多或少的重要性权重,从而将其目标设置为无。记录新的最佳候选项。生成因子空间最佳区域的图形摘要。
创建一个包含 50, 000 行的数据表,这些行填充了允许因子空间内随机生成的因子设置,以及来自每个响应的简化模型中的相应预测值,以及联合合意性函数。选择输出随机表。将要模拟的运行次数的值更改为 50, 000,然后单击确定。
在新创建的表中,添加一个新列,用于计算合意性列的百分位数。在三元图中使用此百分位数列,而不是原始合意性列。右键单击合意性列标题,然后选择新建公式列、分布、累积概率。
生成以下图形。反复更改图形的配色方案,以显示每个响应和累积概率列的预测。构建四种脂质因子的三元图。
在表中,导航到图形三元图。选择 X 图解的混合因子,然后单击确定。右键单击其中一个生成的图形,选择行图例,然后选择预测响应列。
将颜色下拉列表更改为 Jet。这将显示相对于脂质因子表现最佳和最差的区域。当前图显示了当考虑将重要续集的效力最大化为 1 时,以及使用重要续集将 0.2 的大小最小化时,联合合意性的百分位数。
在对三元图轴上未显示的任何因子求平均值时。反复更改图形的配色方案,以显示每个响应的预测。同样,根据非混合过程因子(单数或联合)绘制代表独特配方的 50, 000 个颜色编码点,并查找响应和因子之间的关系。
查找在最高合意性中产生点产量的因子设置。该图显示了三种离子化脂质类型中每种可以形成的所有制剂的联合合意性。最理想的配方使用H102,H101提供了一些潜在的竞争替代品。
探索可能导致不同响应的不同因素组合。将预测探查器及其记住的设置保存回数据表。准备一个表格,列出之前确定的最佳候选项。
将基准控制包含在将制定和测量的候选游程集中。如果发现实验中的任何配方产生了理想的结果,也许是优于基准,请选择最好的配方添加到候选表中,并与新配方一起重新测试。右键单击分析器中记住的设置表,然后选择"制作成数据表"。
执行确认运行,构建配方并收集读数。比较候选最佳配方的性能。该工作流程已用于许多应用程序。
在大多数情况下,我们观察到,与一次使用一个因子优化设置的基准配方相比,效力至少提高了四到五倍。当二级反应共同针对时,改进尤其明显。还可以使用模拟来显示此过程产生的最佳候选者的预期质量。
使用本文中描述的示例实验的已知数据生成函数,我们可以将从该工作流程中使用的空间填充设计和基于SVEM的分析中获得的候选最佳配方的质量与传统混合物分析技术获得的质量进行比较。垂直轴上显示了最优公式的质量,水平轴上显示了设计中的运行次数,蓝点表示 150 次模拟中未简化的完整统计模型的性能。琥珀色点表示基于 AICC 目标函数的传统单发前向选择的性能。
绿点表示此工作流中使用的基于 SVEM 的前向选择方法的性能。SWEM分析使我们能够获得更好的最佳候选和更少的运行。偶尔会有额外的复杂性研究,需要统计学家的帮助进行设计和分析。
对于优先级极高的研究,其中运行规模比平时更有限,或者存在大量分类因子,或者具有大量水平的单个分类因子,统计学家可能会以不同的方式处理。使用最佳或混合设计代替工作流程中指定的空间填充设计。