Este artigo fornece um fluxo de trabalho para os cientistas construírem uma tabela de planejamento experimental e analisarem resultados experimentais sobre uma variedade de fatores de mistura e processo, sem exigir decisões estatísticas tediosas e potencialmente voláteis. Os modelos resultantes podem ser otimizados em conjunto sobre múltiplas respostas e usados para produzir gráficos informativos para resumir tanto a superfície de resposta conjunta quanto as previsões das respostas individuais. Esses gráficos são mais fáceis de interpretar do que as estimativas de parâmetros dos modelos estatísticos subjacentes e são úteis para representar as configurações de fatores que produzem as respostas mais desejáveis.
Os cientistas de formulação de lipídios e nanopartículas frequentemente precisam construir novas receitas para diferentes cargas úteis ou ao alterar lipídios ou configurações de processo. Fornecemos uma abordagem robusta para otimização de formulação que minimiza o potencial de erro na construção do projeto e evita a necessidade de extenso conhecimento estatístico e durante a análise. Resuma o objetivo do experimento em um documento com carimbo de data.
Liste as respostas que serão medidas durante o experimento. Selecione os fatores que serão variados e aqueles que serão mantidos constantes durante o estudo. Estabeleça os intervalos para os fatores variáveis e a precisão decimal relevante para cada um.
Decida o tamanho do desenho do estudo usando as heurísticas mínima e máxima. Abra o salto e navegue na barra de menus até DOI, Special Purpose, Space Filling Design. Insira as respostas do estudo.
Insira os fatores de estudo e os intervalos. Insira o número predeterminado de execuções para o design. Gere a tabela de design de preenchimento de espaço para os fatores escolhidos e o tamanho da execução.
Adicione uma coluna de anotações à tabela para anotar todas as execuções criadas manualmente. Se aplicável, incorpore manualmente as execuções de controle de benchmark na tabela de design. Inclua uma réplica para um dos benchmarks controlados.
Marque o nome do benchmark na coluna de anotações e o código de cores das linhas de replicação do benchmark para facilitar a identificação correta. Arredondar a mistura de níveis de fator para a granularidade apropriada. Copie os valores arredondados e cole-os nas colunas originais.
Exclua as cópias redundantes das colunas arredondadas. Depois de arredondar os fatores lipídicos, verifique se sua soma é igual a 100%Se a soma de linhas não for igual a um, ajuste manualmente um dos fatores de mistura, garantindo que ele permaneça dentro da faixa de fatores. Exclua a coluna de soma depois que os ajustes forem feitos.
Siga o mesmo procedimento usado para arredondar os fatores de mistura para arredondar os fatores de processo para sua respectiva granularidade. Formate as colunas lipídicas para que apareçam como porcentagens com um número desejado de decimais. Se você adicionou execuções manuais, como benchmarks, randomize novamente a ordem das linhas da tabela, adicione uma nova coluna com valores arredondados.
Classifique essa coluna em ordem crescente clicando com o botão direito do mouse no cabeçalho da coluna e exclua a coluna. Gere gráficos ternários para visualizar os pontos de projeto sobre os fatores lipídicos. Examine também a distribuição de execução sobre os fatores de processo.
Os cientistas da formulação devem confirmar a viabilidade de todas as corridas. Se existirem execuções inviáveis, reinicie o design considerando as restrições recém-descobertas. Execute o experimento na ordem fornecida pela tabela de design.
Registre as leituras na coluna incorporada à tabela experimental. Plote as leituras e examine as distribuições das respostas. Examine a distância relativa entre as execuções de réplica codificadas por cores se uma foi incluída, isso permite a compreensão do processo total e da variação analítica no benchmark, em comparação com a variabilidade devido às mudanças nas configurações de fator em todo o espaço fatorial.
Crie as corridas em um terreno ternário. Colora os pontos de acordo com as respostas para obter uma visão independente do modelo do comportamento sobre os fatores de mistura. Clique com o botão direito do mouse em qualquer um dos gráficos resultantes, selecione Legenda da linha e, em seguida, selecione a coluna de resposta.
Repita isso para cada resposta. Construir um modelo independente para cada resposta em função dos fatores de estudo. Exclua os scripts de modelo que foram criados pelo design de preenchimento de espaço.
Selecione Analisar, Ajustar modelo. Construa um modelo completo que inclua todos os efeitos candidatos. Este modelo deve incluir os efeitos principais de cada fator, interações de duas e três vias, termos cúbicos quadráticos e parciais nos fatores de processo e termos cúbicos de Scheffe para os fatores de mistura.
Selecione todos os fatores do estudo. Altere a entrada de grau para três do padrão de dois. Em seguida, selecione um Fatorial para Grau.
Selecione apenas os fatores que não são de mistura e, em seguida, selecione Macros, Cubic parcial. Selecione apenas os fatores de mistura e, em seguida, selecione Macros, Scheffe Cubic. Desative a opção padrão sem interceptação.
Especifique a coluna de resposta, altere a Personalidade para Regressão Generalizada. Salve esse modelo configurado na tabela de dados para facilitar a recuperação. Selecione Salvar na tabela de dados.
Clique em Executar. Para o método de estimativa, selecione SVEM Forward Selection. Expanda os menus Termos de Força de Controles Avançados e desmarque as caixas correspondentes aos efeitos principais da mistura.
Apenas o termo do Intercept permanecerá verificado. Clique em Go.Plotar as respostas reais por suas respostas previstas do modelo SVEM para verificar uma previsibilidade razoável. Clique no triângulo vermelho ao lado de SVEM Forward Selection e selecione Save Columns, Save Prediction Formula (Salvar colunas, Save Prediction Formula).
Isso cria uma nova coluna contendo a fórmula de previsão na tabela de dados Repita as etapas de criação do modelo para cada resposta. Depois que todas as respostas tiverem colunas de previsão salvas na tabela de dados, plote os rastreamentos de resposta para todas as colunas de resposta previstas usando uma função de criador de perfil. Selecione Graph Profiler e selecione todas as colunas de previsão criadas na etapa anterior para a fórmula de previsão Y, clique em OK.
Identificar as formulações ideais candidatas. Defina a função desejabilidade para cada resposta, se ela deve ser maximizada, minimizada ou correspondida a um alvo. Isso também implica definir os pesos de importância relativa para cada resposta.
Para gerar o primeiro candidato, defina todas as respostas primárias para usar peso de importância 1,0 e quaisquer respostas secundárias para usar peso de importância 0,2. Instrua o criador de perfil a encontrar as configurações de fator ideais que maximizam a função desejabilidade. Selecione Optimization Desirability, Maximize Desirability.
Registre as configurações de fator ideal junto com uma nota sobre as ponderações de importância usadas para cada resposta. Para fatores categóricos, como tipo de lipídio ionizável, encontre as formulações condicionalmente ótimas para cada nível de fator. Primeiro, defina o nível desejado de cada fator no criador de perfil.
Em seguida, mantenha pressionada a tecla de controle e clique com o botão esquerdo do mouse dentro do gráfico desse fator e selecione Configuração do fator de bloqueio. Esta otimização de seleção e desejabilidade, maximizar a desejabilidade de encontrar o ótimo condicional com este fator bloqueado em sua configuração atual. Quando terminar, desbloqueie as configurações de fator antes de prosseguir.
Repita o processo de otimização depois de modificar os pesos de importância da resposta, talvez apenas otimizando as respostas primárias ou definindo algumas das respostas secundárias para ter mais ou menos peso de importância, definindo sua meta como nenhuma. Registre o novo candidato ideal. Produzir resumos gráficos das regiões ótimas do espaço fatorial.
Crie uma tabela de dados que contenha 50.000 linhas que são preenchidas com configurações de fator geradas aleatoriamente dentro do espaço de fator permitido, juntamente com os valores previstos correspondentes dos modelos reduzidos para cada uma das respostas, bem como a função de desejabilidade conjunta. Selecione Tabela aleatória de saída. Altere o valor de quantas execuções simular para 50, 000 e clique em OK.
Na tabela recém-criada, adicione uma nova coluna que calcule o percentil da coluna desejabilidade. Use essa coluna de percentil nos gráficos ternários em vez da coluna de desejabilidade bruta. Clique com o botão direito do mouse no cabeçalho da coluna Desejabilidade e selecione Nova Coluna de Fórmula, Distribuição, Probabilidade Cumulativa.
Gere os gráficos a seguir. Altere repetidamente o esquema de cores dos gráficos para exibir as previsões para cada resposta e para a coluna de probabilidade cumulativa. Construa gráficos ternários para os quatro fatores lipídicos.
Na tabela, navegue até gráfico ternário. Selecione os fatores de mistura para plotagem X e clique em OK. Clique com o botão direito do mouse em um dos gráficos resultantes, selecione Legenda da linha e, em seguida, selecione a coluna de resposta prevista.
Altere a lista suspensa de cores para Jet. Isso mostrará as regiões com melhor e pior desempenho em relação aos fatores lipídicos. A figura atual mostra os percentis da desejabilidade articular quando se considera maximizar a potência com sequência importante para 1, e minimizar o tamanho com sequela importante para 0,2.
Calculando a média sobre quaisquer fatores que não são mostrados no eixo ternário do gráfico. Altere repetidamente o esquema de cores dos gráficos para exibir as previsões para cada resposta. Da mesma forma, plote os 50.000 pontos codificados por cores que representam formulações únicas contra os fatores de processo de não-mistura, singulares ou conjuntos, e procure relações entre as respostas e os fatores.
Procure as configurações de fator que produzem o rendimento de pontos na maior desejabilidade. Esta figura mostra a conveniência conjunta de todas as formulações que poderiam ser formadas com cada um dos três tipos de lipídios ionizados. As formulações mais desejáveis utilizam H102, com H101 fornecendo algumas alternativas potencialmente competitivas.
Explore diferentes combinações de fatores que podem levar a diferentes respostas. Salve o criador de perfil de previsão e suas configurações lembradas de volta à tabela de dados. Prepare uma tabela listando os candidatos ideais identificados anteriormente.
Inclua o controle de benchmark com o conjunto de execuções candidatas que serão formuladas e medidas. Se alguma das formulações do experimento produzir resultados desejáveis, talvez superando o benchmark, selecione a melhor para adicionar à tabela candidata e teste novamente junto com novas formulações. Clique com o botão direito do mouse na tabela de configurações lembradas no criador de perfil e selecione Transformar em tabela de dados.
Realize as corridas de confirmação, construa as formulações e reúna as leituras. Comparar o desempenho das formulações ótimas candidatas. O fluxo de trabalho tem sido usado em muitos aplicativos.
Na maioria dos casos, observamos pelo menos uma melhora de quatro a cinco vezes na potência quando comparamos com formulações de referência que foram definidas usando otimização de um fator de cada vez. As melhorias são especialmente perceptíveis quando as respostas secundárias são direcionadas conjuntamente. Também é possível usar a simulação para mostrar a qualidade esperada dos candidatos ótimos produzidos por este procedimento.
Usando uma função de geração de dados conhecida para o experimento de exemplo descrito no artigo, podemos comparar a qualidade das formulações ótimas candidatas obtidas a partir dos projetos de preenchimento de espaço e análise baseada em SVEM usados neste fluxo de trabalho com aquelas obtidas a partir das técnicas tradicionais de análise de misturas. Com a qualidade da formulação ótima mostrada no eixo vertical e o número de execuções no delineamento mostrado no eixo horizontal, os pontos azuis representam o desempenho do modelo estatístico completo não reduzido ao longo de 150 simulações. Os pontos âmbar representam o desempenho da tradicional seleção de tiro único para frente com base na função objetivo AICC.
Os pontos verdes representam o desempenho da abordagem de seleção direta baseada em SVEM usada neste fluxo de trabalho. A análise SVEM nos permite obter melhores candidatos ótimos e menos execuções. Haverá estudos ocasionais com complexidade adicional que requerem o auxílio de um estatístico para desenho e análise.
Estudos que são de altíssima prioridade, onde o tamanho da corrida é mais limitado do que o habitual, ou há um grande número de fatores categóricos, ou um único fator categórico com um grande número de níveis podem ser abordados de forma diferente por um estatístico. Usando designs ideais ou híbridos no lugar do design de preenchimento de espaço especificado no fluxo de trabalho.