Questo articolo fornisce agli scienziati un flusso di lavoro per costruire una tabella di progettazione sperimentale e analizzare i risultati sperimentali su una varietà di fattori di miscela e processo, senza richiedere decisioni statistiche noiose e potenzialmente volatili. I modelli risultanti possono essere ottimizzati congiuntamente su più risposte e utilizzati per produrre grafici informativi per riassumere sia la superficie di risposta congiunta che le previsioni delle singole risposte. Questi grafici sono più facili da interpretare rispetto alle stime dei parametri dei modelli statistici sottostanti e sono utili per rappresentare le impostazioni fattoriali che producono le risposte più desiderabili.
Gli scienziati della formulazione di lipidi e nanoparticelle hanno spesso bisogno di costruire nuove ricette per diversi carichi utili o quando si modificano i lipidi o le impostazioni di processo. Forniamo un approccio solido all'ottimizzazione della formulazione che riduce al minimo il potenziale di errore nella costruzione del progetto ed evita la necessità di ampie statistiche e conoscenze durante l'analisi. Riassumere lo scopo dell'esperimento in un documento contrassegnato dalla data.
Elenca le risposte che verranno misurate durante l'esperimento. Seleziona i fattori che saranno variati e quelli che saranno mantenuti costanti durante lo studio. Stabilire gli intervalli per i fattori variabili e la precisione decimale pertinente per ciascuno.
Decidere la dimensione del progetto di studio utilizzando l'euristica minima e massima. Apri il salto e naviga nella barra dei menu fino a DOI, Special Purpose, Space Filling Design. Inserisci le risposte allo studio.
Inserisci i fattori di studio e gli intervalli. Immettere il numero predeterminato di esecuzioni per il progetto. Generare la tabella di progettazione di riempimento dello spazio per i fattori scelti e le dimensioni dell'esecuzione.
Aggiungere una colonna di note alla tabella per annotare eventuali esecuzioni create manualmente. Se applicabile, incorporare manualmente le esecuzioni di controllo del benchmark nella tabella di progettazione. Includi una replica per uno dei benchmark controllati.
Contrassegnare il nome del benchmark nella colonna delle note e codificare a colori le righe di replica del benchmark per una facile identificazione corretta. Arrotondare la miscela dei livelli dei fattori alla granularità appropriata. Copiare i valori arrotondati e incollarli nelle colonne originali.
Eliminare le copie ridondanti delle colonne arrotondate. Dopo aver arrotondato i fattori lipidici, verificare che la loro somma sia uguale al 100% Se la somma delle righe non è uguale a una, regolare manualmente uno dei fattori di miscela, assicurandosi che rimanga all'interno dell'intervallo di fattori. Eliminare la colonna di somma dopo aver apportato le modifiche.
Seguire la stessa procedura utilizzata per arrotondare i fattori di miscela per arrotondare i fattori di processo alla rispettiva granularità. Formattare le colonne lipidiche in modo che vengano visualizzate come percentuali con un numero desiderato di decimali. Se sono state aggiunte esecuzioni manuali, ad esempio benchmark, modificare la casualità dell'ordine delle righe della tabella e aggiungere una nuova colonna con valori arrotondati.
Ordinare la colonna in ordine crescente facendo clic con il pulsante destro del mouse sull'intestazione della colonna e quindi eliminare la colonna. Genera grafici ternari per visualizzare i punti di progettazione sui fattori lipidici. Esaminare inoltre la distribuzione dell'esecuzione sui fattori di processo.
Gli scienziati della formulazione dovrebbero confermare la fattibilità di tutte le esecuzioni. Se esistono esecuzioni non fattibili, riavviare la progettazione tenendo conto dei vincoli appena individuati. Eseguire l'esperimento nell'ordine fornito dalla tabella dati.
Registrare le letture nella colonna incorporata nella tabella sperimentale. Traccia le letture ed esamina le distribuzioni delle risposte. Esaminare la distanza relativa tra le esecuzioni di replica codificate a colori se ne è stata inclusa una, ciò consente la comprensione del processo totale e della variazione analitica al benchmark, rispetto alla variabilità dovuta ai cambiamenti nelle impostazioni dei fattori nell'intero spazio fattoriale.
Crea le piste su un appezzamento ternario. Colorare i punti in base alle risposte per ottenere una visione indipendente dal modello del comportamento rispetto ai fattori di miscela. Fare clic con il pulsante destro del mouse su uno dei grafici risultanti, selezionare Legenda riga e quindi selezionare la colonna di risposta.
Ripeti questa operazione per ogni risposta. Costruire un modello indipendente per ogni risposta in funzione dei fattori di studio. Eliminare gli script del modello creati dalla progettazione di riempimento dello spazio.
Selezionare Analizza, Adatta modello (Fit Model). Costruisci un modello completo che comprenda tutti gli effetti candidati. Questo modello dovrebbe includere gli effetti principali di ciascun fattore, interazioni a due e tre vie, termini cubici quadratici e parziali nei fattori di processo e termini cubici di Scheffe per i fattori di miscela.
Seleziona tutti i fattori di studio. Modificare la voce per grado a tre dal valore predefinito di due. Quindi selezionare un fattoriale a Grado.
Selezionare solo i fattori non di miscela, quindi selezionare Macro, Cubo parziale. Selezionare solo i fattori di miscela, quindi selezionare Macro, Scheffe Cubic. Disattivare l'opzione predefinita di non intercettare.
Specificare la colonna di risposta, cambiare la personalità in regressione generalizzata. Salvare questo modello impostato nella tabella dati per un facile richiamo. Selezionare Salva nella tabella dati.
Fare clic su Esegui. Per il metodo di stima, selezionare SVEM Forward Selection. Espandi i menu Termini forza controlli avanzati e deseleziona le caselle corrispondenti agli effetti principali della miscela.
Solo il termine Intercept rimarrà controllato. Fare clic su Vai.Tracciare le risposte effettive in base alle risposte previste dal modello SVEM per verificare una ragionevole prevedibilità. Fare clic sul triangolo rosso accanto a Selezione diretta SVEM e selezionare Salva colonne, Salva formula di stima.
Verrà creata una nuova colonna contenente la formula di stima nella tabella dati Ripetere i passaggi di creazione del modello per ogni risposta. Dopo che tutte le risposte hanno salvato le colonne di stima nella tabella dati, tracciare le tracce di risposta per tutte le colonne di risposta previste utilizzando una funzione profiler. Selezionare Graph Profiler e selezionare tutte le colonne di stima create nel passaggio precedente per la formula di stima Y, fare clic su OK.
Identificare le formulazioni ottimali dei candidati. Impostare la funzione di desiderabilità per ogni risposta se deve essere massimizzata, ridotta a icona o abbinata a un obiettivo. Ciò comporta anche l'impostazione dei pesi di importanza relativa per ciascuna risposta.
Per generare il primo candidato, impostare le risposte primarie per utilizzare il peso di importanza 1.0 e le risposte secondarie per utilizzare il peso di importanza 0.2. Indicare al profiler di trovare le impostazioni dei fattori ottimali che massimizzano la funzione di desiderabilità. Selezionare Desiderabilità ottimizzazione, Massimizza desiderabilità.
Registrare le impostazioni ottimali dei fattori insieme a una nota sulle ponderazioni di importanza utilizzate per ogni risposta. Per fattori categoriali come il tipo lipidico ionizzabile, trovare le formulazioni condizionatamente ottimali per ciascun livello di fattori. Innanzitutto, impostare il livello desiderato di ciascun fattore nel profiler.
Quindi tenere premuto il tasto Ctrl e fare clic con il pulsante sinistro del mouse all'interno del grafico di quel fattore e selezionare Blocca impostazione fattore. Questa selezione di ottimizzazione e desiderabilità, massimizza la desiderabilità di trovare l'optimum condizionale con questo fattore bloccato nella sua impostazione corrente. Al termine, sbloccare le impostazioni del fattore prima di procedere.
Ripeti il processo di ottimizzazione dopo aver modificato i pesi di importanza della risposta, magari ottimizzando solo le risposte primarie o impostando alcune delle risposte secondarie per avere un peso più o meno importante, impostando il loro obiettivo su nessuno. Registrare il nuovo candidato ottimale. Produrre riepiloghi grafici delle regioni ottimali dello spazio fattoriale.
Creare una tabella di dati contenente 50.000 righe popolate con impostazioni fattoriali generate casualmente all'interno dello spazio fattoriale consentito, insieme ai corrispondenti valori previsti dai modelli ridotti per ciascuna delle risposte, nonché alla funzione di desiderabilità congiunta. Selezionare Output Random Table. Modificare il valore di quante esecuzioni simulare in 50.000 e fare clic su OK.
Nella tabella appena creata aggiungere una nuova colonna che calcola il percentile della colonna di desiderabilità. Utilizzare questa colonna percentile nei grafici ternari anziché la colonna di desiderabilità non elaborata. Fare clic con il pulsante destro del mouse sull'intestazione della colonna Desiderabilità e selezionare Nuova colonna formula, Distribuzione, Probabilità cumulativa.
Generare i seguenti elementi grafici. Modificare ripetutamente la combinazione di colori della grafica per visualizzare le stime per ogni risposta e per la colonna delle probabilità cumulative. Costruire grafici ternari per i quattro fattori lipidici.
Nella tabella passare al grafico ternario grafico. Selezionate i fattori di combinazione per il plottaggio X e fate clic su OK (Okay). Fare clic con il pulsante destro del mouse in uno dei grafici risultanti, selezionare Legenda riga e quindi selezionare la colonna di risposta prevista.
Modificare il menu a discesa dei colori in Jet. Questo mostrerà le regioni migliori e peggiori rispetto ai fattori lipidici. La figura attuale mostra i percentili della desiderabilità congiunta quando si considera la massimizzazione della potenza con un sequel importante a 1 e la minimizzazione delle dimensioni con un sequel importante a 0,2.
Durante la media su tutti i fattori che non sono mostrati sull'asse ternario del plottaggio. Modificare ripetutamente la combinazione di colori della grafica per visualizzare le previsioni per ogni risposta. Allo stesso modo, tracciare i 50.000 punti codificati a colori che rappresentano formulazioni uniche rispetto ai fattori di processo non miscelati singolarmente o congiuntamente e cercare relazioni tra le risposte e i fattori.
Cerca le impostazioni dei fattori che producono il rendimento dei punti nella massima desiderabilità. Questa figura mostra la desiderabilità congiunta di tutte le formulazioni che potrebbero essere formate con ciascuno dei tre tipi di lipidi ionizzati. Le formulazioni più desiderabili utilizzano H102, con H101 che fornisce alcune alternative potenzialmente competitive.
Esplora diverse combinazioni di fattori che potrebbero portare a risposte diverse. Salvare il profiler di previsione e le relative impostazioni memorizzate nella tabella dati. Preparare una tabella che elenca i candidati ottimali identificati in precedenza.
Includi il controllo del benchmark con il set di esecuzioni candidate che verranno formulate e misurate. Se una qualsiasi delle formulazioni dell'esperimento è risultata produrre risultati desiderabili, magari sovraperformando il benchmark, selezionare il meglio da aggiungere alla tabella dei candidati e ripetere il test insieme alle nuove formulazioni. Fare clic con il pulsante destro del mouse sulla tabella delle impostazioni memorizzate nel profiler e selezionare Crea in tabella dati.
Esegui le prove di conferma, costruisci le formulazioni e raccogli le letture. Confronta le prestazioni delle formulazioni ottimali del candidato. Il flusso di lavoro è stato utilizzato in molte applicazioni.
Nella maggior parte dei casi, abbiamo osservato un miglioramento della potenza da quattro a cinque volte quando ci confrontiamo con le formulazioni di riferimento che sono state impostate utilizzando un fattore alla volta di ottimizzazione. I miglioramenti sono particolarmente evidenti quando le risposte secondarie sono mirate congiuntamente. È anche possibile utilizzare la simulazione per mostrare la qualità attesa dei candidati ottimali prodotti da questa procedura.
Utilizzando una funzione di generazione dati nota per l'esperimento di esempio descritto nel documento, possiamo confrontare la qualità delle formulazioni ottimali candidate ottenute dai progetti di riempimento dello spazio e dall'analisi basata su SVEM utilizzate in questo flusso di lavoro con quelle ottenute dalle tradizionali tecniche di analisi delle miscele. Con la qualità della formulazione ottimale mostrata sull'asse verticale e il numero di esecuzioni nel progetto mostrato sull'asse orizzontale, i punti blu rappresentano le prestazioni del modello statistico completo non ridotto su 150 simulazioni. I punti ambra rappresentano le prestazioni della tradizionale selezione in avanti a colpo singolo basata sulla funzione obiettivo AICC.
I punti verdi rappresentano le prestazioni dell'approccio di selezione diretta basato su SVEM utilizzato in questo flusso di lavoro. L'analisi SVEM ci consente di ottenere candidati ottimali migliori e meno tirature. Ci saranno studi occasionali con complessità aggiuntiva che richiedono l'aiuto di uno statistico per la progettazione e l'analisi.
Gli studi che hanno una priorità estremamente elevata, in cui la dimensione della tiratura è più limitata del solito, o ci sono un gran numero di fattori categoriali, o un singolo fattore categoriale con un gran numero di livelli possono essere affrontati in modo diverso da uno statistico. Utilizzando progetti ottimali o ibridi al posto del design di riempimento dello spazio specificato nel flusso di lavoro.