В этой статье представлен рабочий процесс для ученых по созданию таблицы планирования экспериментов и анализу экспериментальных результатов по различным смесям и технологическим факторам, не требуя утомительных и потенциально изменчивых статистических решений. Полученные модели могут быть совместно оптимизированы для нескольких ответов и использованы для создания информативной графики для обобщения как совместной поверхности ответа, так и прогнозов отдельных ответов. Эти графики легче интерпретировать, чем оценки параметров из базовых статистических моделей, и они полезны для представления настроек факторов, которые дают наиболее желательные ответы.
Ученым, занимающимся разработкой липидов и наночастиц, часто приходится создавать новые рецепты для различных полезных нагрузок или при изменении липидов или настроек процесса. Мы обеспечиваем надежный подход к оптимизации рецептур, который сводит к минимуму вероятность ошибки при построении проекта и позволяет избежать необходимости в обширных статистических данных и знаниях во время анализа. Кратко изложите цель эксперимента в документе с отметкой даты.
Перечислите ответы, которые будут измеряться во время эксперимента. Выберите факторы, которые будут варьироваться, и те, которые будут оставаться постоянными во время исследования. Установите диапазоны для различных множителей и соответствующую десятичную точность для каждого из них.
Определите размер дизайна исследования, используя минимальную и максимальную эвристику. Откройте прыжок и перейдите в строку меню к DOI, Special Purpose, Space Filling Design. Введите ответы на исследование.
Введите исследуемые коэффициенты и диапазоны. Введите заданное количество запусков для проекта. Создайте таблицу проектирования заполнения пространства для выбранных факторов и размера прогона.
Добавьте в таблицу столбец примечаний для аннотирования всех созданных вручную запусков. Если применимо, вручную включите контрольные запуски тестов в таблицу проектирования. Включите репликацию для одного из контролируемых тестов производительности.
Отметьте имя теста в столбце примечаний и раскрасьте строки репликации эталона для упрощения правильной идентификации. Округлите смесь уровней факторов до соответствующей детализации. Скопируйте округленные значения и вставьте их в исходные столбцы.
Удалите лишние копии скругленных столбцов. После округления липидных коэффициентов убедитесь, что их сумма равна 100%Если какая-либо сумма строк не равна одному, вручную отрегулируйте один из коэффициентов смеси, убедившись, что он остается в пределах диапазона коэффициентов. Удалите столбец суммы после внесения корректировок.
Следуйте той же процедуре, которая используется для округления коэффициентов смешивания, чтобы округлить технологические факторы до их соответствующей степени детализации. Отформатируйте липидные столбцы так, чтобы они отображались в процентах с желаемым количеством десятичных знаков. Если вы добавили ручные запуски, такие как контрольные тесты, повторно рандомизируйте порядок строк таблицы, добавьте новый столбец с округленными значениями.
Отсортируйте этот столбец в порядке возрастания, щелкнув правой кнопкой мыши заголовок столбца, а затем удалите столбец. Создавайте троичные графики для визуализации точек дизайна над липидными факторами. Кроме того, изучите распределение прогонов по факторам процесса.
Рецептура ученых должна подтвердить осуществимость всех прогонов. Если существуют невыполнимые запуски, перезапустите проект с учетом вновь обнаруженных ограничений. Запустите эксперимент в порядке, указанном в таблице конструктора.
Запишите показания в столбец, встроенный в экспериментальную таблицу. Нанесите показания на график и изучите распределение ответов. Изучите относительное расстояние между цветными кодированными тиражами репликации, если они были включены, это позволяет понять общий процесс и аналитические вариации в эталоне по сравнению с изменчивостью из-за изменений настроек факторов во всем пространстве факторов.
Крафтите прогоны на троичных участках. Раскрасьте точки в соответствии с ответами, чтобы получить независимое от модели представление о поведении по смешанным факторам. Щелкните правой кнопкой мыши любой из результирующих графиков, выберите «Легенда строки», а затем выберите столбец ответа.
Повторите это для каждого ответа. Постройте независимую модель для каждого ответа в зависимости от исследуемых факторов. Удалите сценарии модели, созданные проектом заполнения пространства.
Выберите «Анализ», «Подогнать модель». Постройте полную модель, включающую все возможные эффекты. Эта модель должна включать основные эффекты каждого фактора, двух- и трехсторонних взаимодействий, квадратичные и частичные кубические члены в факторах процесса и кубические члены Шеффе для коэффициентов смеси.
Выберите все факторы исследования. Измените запись для степени на три с двух по умолчанию. Затем выберите Factorial to Degree.
Выберите только коэффициенты без смешивания, а затем выберите Макросы, Частичный кубический. Выберите только коэффициенты смешивания, а затем выберите Macros, Scheffe Cubic. Отключите параметр по умолчанию без перехвата.
Укажите столбец ответа, измените Личность на Обобщенная регрессия. Сохраните эту модель в таблице данных для удобного вызова. Выберите Сохранить в таблицу данных.
Нажмите кнопку Выполнить. В качестве метода оценки выберите SVEM Forward Selection. Разверните меню Advanced Controls Force Terms и снимите флажки, соответствующие основным эффектам смеси.
Только термин «Перехват» останется отмеченным. Нажмите кнопку Перейти.Построение фактических ответов по их прогнозируемым ответам из модели SVEM, чтобы проверить разумную предсказуемость. Нажмите на красный треугольник рядом с SVEM Forward Selection и выберите Save Columns, Save Prediction Formula (Сохранить столбцы), Save Prediction Formula (Сохранить формулу прогноза).
При этом создается новый столбец, содержащий формулу прогноза в таблице данных Повторите шаги построения модели для каждого ответа. После того как все ответы будут сохранены в таблице данных, отстройте трассировки ответов для всех прогнозируемых столбцов ответов с помощью функции профилировщика. Выберите Профилировщик диаграмм и выберите все столбцы прогнозирования, созданные на предыдущем шаге для формулы прогноза Y, нажмите кнопку ОК.
Определите оптимальные рецептуры-кандидаты. Установите функцию желательности для каждого ответа, должен ли он быть максимизирован, минимизирован или сопоставлен с целью. Это также влечет за собой установку весов относительной важности для каждого ответа.
Чтобы сгенерировать первого кандидата, задайте для всех первичных ответов вес важности 1,0, а для всех вторичных ответов — вес важности 0,2. Поручите профилировщику найти оптимальные настройки коэффициента, которые максимизируют функцию желательности. Выберите «Желательность оптимизации», «Максимизировать желательность».
Запишите оптимальные настройки коэффициента вместе с примечанием о весовых коэффициентах важности, используемых для каждого ответа. Для категориальных факторов, таких как ионизируемый тип липидов, найдите условно оптимальные составы для каждого факторного уровня. Во-первых, установите желаемый уровень каждого фактора в профилировщике.
Затем, удерживая клавишу управления, щелкните левой кнопкой мыши внутри графика этого фактора и выберите «Настройка коэффициента блокировки». Это выбор оптимизации и желательности, максимизация желательности нахождения условного оптимума с этим фактором, заблокированным в его текущем значении. Когда закончите, разблокируйте настройки фактора, прежде чем продолжить.
Повторите процесс оптимизации после изменения весов важности ответа, возможно, только оптимизируя первичные ответы или установив для некоторых вторичных ответов больший или меньший вес важности, тем самым установив их цель равной нулю. Запишите нового оптимального кандидата. Создание графических сводок оптимальных областей факторного пространства.
Создайте таблицу данных, содержащую 50 000 строк, заполненных случайно сгенерированными параметрами факторов в пределах допустимого пространства факторов вместе с соответствующими прогнозируемыми значениями из редуцированных моделей для каждого из ответов, а также совместной функцией желательности. Выберите Вывод случайной таблицы. Измените значение количества имитируемых запусков на 50 000 и нажмите кнопку ОК.
Во вновь созданной таблице добавьте новый столбец, вычисляющий процентиль столбца желательности. Используйте этот столбец процентиля на троичных графиках вместо столбца необработанной желательности. Щелкните правой кнопкой мыши заголовок столбца "Желательность" и выберите "Новый столбец формулы", "Распределение", "Совокупная вероятность".
Создайте следующую графику. Неоднократно изменяйте цветовую схему графика, чтобы отобразить прогнозы для каждого ответа и для столбца кумулятивной вероятности. Постройте тройные графики для четырех липидных факторов.
В таблице перейдите к троичному графику графика. Выберите коэффициенты смешивания для построения графика X и нажмите кнопку «ОК». Щелкните правой кнопкой мыши на одном из результирующих графиков, выберите "Легенда строки", а затем выберите столбец прогнозируемого ответа.
Измените цвета в раскрывающемся списке на Jet. Это покажет лучшие и худшие регионы с точки зрения липидных факторов. Текущий рисунок показывает процентили желательности суставов при рассмотрении максимизации потенции с важным продолжением 1 и минимизации размера с важным продолжением до 0,2.
При усреднении по любым факторам, которые не отображаются на троичной оси графика. Неоднократно изменяйте цветовую схему графика, чтобы отобразить прогнозы для каждого ответа. Аналогичным образом, нанесите на график 50 000 точек с цветовой кодировкой, представляющих уникальные составы, по сравнению с несмешанными технологическими факторами, как по отдельности, так и совместно, и найдите взаимосвязи между реакциями и факторами.
Обратите внимание на настройки коэффициентов, которые приводят к получению очков с наибольшей желательностью. На этом рисунке показана совместная желательность всех составов, которые могут быть образованы с каждым из трех типов ионизированных липидов. В наиболее желательных составах используется Н102, а Н101 обеспечивает некоторые потенциально конкурентоспособные альтернативы.
Изучите различные комбинации факторов, которые могут привести к различным ответам. Сохраните профилировщик прогнозов и его запомненные параметры обратно в таблицу данных. Подготовьте таблицу, в которой перечислены оптимальные кандидаты, выявленные ранее.
Включите контрольный тест с набором потенциальных запусков, которые будут сформулированы и измерены. Если было обнаружено, что какой-либо из составов из эксперимента дает желаемые результаты, возможно, превосходя контрольный показатель, выберите лучший для добавления в таблицу-кандидат и повторите тестирование вместе с новыми составами. Щелкните правой кнопкой мыши запомненную таблицу настроек в профилировщике и выберите «Преобразовать в таблицу данных».
Выполните прогоны подтверждения, составьте формулировки и соберите показания. Сравните показатели кандидата с оптимальными рецептурами. Рабочий процесс использовался во многих приложениях.
В большинстве случаев мы наблюдали, по крайней мере, четырех-пятикратное улучшение потенции при сравнении с эталонными составами, которые были установлены с использованием одного фактора за раз. Улучшения особенно заметны, когда вторичные ответы нацелены совместно. Также можно использовать моделирование, чтобы показать ожидаемое качество оптимальных кандидатов, полученных с помощью этой процедуры.
Используя известную функцию генерации данных для примера эксперимента, описанного в статье, мы можем сравнить качество оптимальных рецептур, полученных из конструкций заполнения пространства и анализа на основе SVEM, используемых в этом рабочем процессе, с теми, которые получены с помощью традиционных методов анализа смесей. С качеством оптимальной формулировки, показанным на вертикальной оси, и количеством прогонов в проекте, показанным на горизонтальной оси, синие точки представляют производительность несокращенной полной статистической модели за 150 симуляций. Желтые точки представляют собой производительность традиционного одиночного выбора вперед на основе целевой функции AICC.
Зеленые точки обозначают производительность подхода прямого выбора на основе SVEM, используемого в этом рабочем процессе. Анализ SVEM позволяет нам получать лучших оптимальных кандидатов и меньшее количество прогонов. Время от времени будут проводиться исследования с дополнительной сложностью, которые потребуют помощи статистиков для разработки и анализа.
Исследования с чрезвычайно высоким приоритетом, в которых размер пробега более ограничен, чем обычно, или имеется большое количество категориальных факторов, или один категориальный фактор с большим числом уровней, могут быть по-разному подойдены статистиком. Использование оптимальных или гибридных конструкций вместо конструкции заполнения пространства, указанной в рабочем процессе.