Cet article fournit un flux de travail permettant aux scientifiques de construire un tableau de conception expérimentale et d’analyser les résultats expérimentaux sur une variété de mélanges et de facteurs de processus, sans nécessiter de décisions statistiques fastidieuses et potentiellement volatiles. Les modèles résultants peuvent être optimisés conjointement sur plusieurs réponses et utilisés pour produire des graphiques informatifs afin de résumer à la fois la surface de réponse conjointe et les prédictions des réponses individuelles. Ces graphiques sont plus faciles à interpréter que les estimations de paramètres des modèles statistiques sous-jacents et sont utiles pour représenter les paramètres factoriels qui produisent les réponses les plus souhaitables.
Les scientifiques spécialisés dans la formulation de lipides et de nanoparticules doivent souvent élaborer de nouvelles recettes pour différentes charges utiles ou lors de la modification des lipides ou des paramètres de processus. Nous fournissons une approche robuste de l’optimisation de la formulation qui minimise le risque d’erreur dans la construction de la conception et évite le besoin de statistiques et de connaissances approfondies lors de l’analyse. Résumez le but de l’expérience dans un document horodaté.
Énumérez les réponses qui seront mesurées au cours de l’expérience. Sélectionnez les facteurs qui seront variés et ceux qui seront maintenus constants pendant l’étude. Établissez les plages pour les différents facteurs et la précision décimale pertinente pour chacun.
Déterminez la taille du plan d’étude en utilisant les heuristiques minimale et maximale. Ouvrez le saut et naviguez dans la barre de menus jusqu’à DOI, Special Purpose, Space Filling Design. Entrez les réponses à l’étude.
Entrez les facteurs d’étude et les fourchettes. Entrez le nombre prédéterminé d’exécutions pour la conception. Générez le tableau de conception de remplissage d’espace pour les facteurs choisis et la taille de l’exécution.
Ajoutez une colonne de notes à la table pour annoter les exécutions créées manuellement. Le cas échéant, incorporez manuellement les exécutions de contrôle de référence dans la table de conception. Inclure une réplique pour l’un des repères contrôlés.
Marquez le nom du banc d’essai dans la colonne notes et codez par couleur les lignes de réplication du banc d’essai pour faciliter l’identification correcte. Arrondir le mélange de niveaux de facteurs à la granularité appropriée. Copiez les valeurs arrondies et collez-les dans les colonnes d’origine.
Supprimez les copies redondantes des colonnes arrondies. Après avoir arrondi les facteurs lipidiques, vérifiez que leur somme est égale à 100%Si une somme de lignes n’est pas égale à un, ajustez manuellement l’un des facteurs de mélange, en veillant à ce qu’il reste dans la plage de facteurs. Supprimez la colonne somme une fois les ajustements effectués.
Suivez la même procédure que celle utilisée pour arrondir les facteurs de mélange afin d’arrondir les facteurs de procédé à leur granularité respective. Formatez les colonnes lipidiques pour qu’elles apparaissent sous forme de pourcentages avec le nombre souhaité de décimales. Si vous avez ajouté des exécutions manuelles telles que des bancs d’essai, rerandomisez l’ordre des lignes du tableau, ajoutez une nouvelle colonne avec des valeurs arrondies.
Triez cette colonne dans l’ordre croissant en cliquant avec le bouton droit sur son en-tête, puis supprimez la colonne. Générez des tracés ternaires pour visualiser les points de conception sur les facteurs lipidiques. Examinez également la répartition de l’exécution sur les facteurs de processus.
Les spécialistes de la formulation doivent confirmer la faisabilité de tous les essais. S’il existe des exécutions irréalisables, redémarrez la conception en tenant compte des contraintes nouvellement découvertes. Exécutez l’expérience dans l’ordre fourni par la table de conception.
Notez les lectures dans la colonne intégrée à la table expérimentale. Tracez les lectures et examinez les distributions des réponses. Examinez la distance relative entre les réplications codées par couleur, le cas échéant, cela permet de comprendre le processus total et la variation analytique au niveau du benchmark, par rapport à la variabilité due aux changements dans les paramètres de facteur dans l’ensemble de l’espace factoriel.
Fabriquez les pistes sur des parcelles ternaires. Colorez les points en fonction des réponses pour obtenir une vue indépendante du modèle du comportement sur les facteurs de mélange. Cliquez avec le bouton droit sur l’un des graphiques résultants, sélectionnez Légende de ligne, puis sélectionnez la colonne de réponse.
Répétez cette opération pour chaque réponse. Construire un modèle indépendant pour chaque réponse en fonction des facteurs de l’étude. Supprimez les scripts de modèle créés par la conception de remplissage d’espace.
Sélectionnez Analyser, Ajuster le modèle. Construire un modèle complet comprenant tous les effets candidats. Ce modèle devrait inclure les principaux effets de chaque facteur, les interactions à deux et trois voies, les termes cubiques quadratiques et partiels dans les facteurs de procédé et les termes cubiques de Scheffe pour les facteurs de mélange.
Sélectionnez tous les facteurs de l’étude. Remplacez l’entrée pour degré par trois par rapport à la valeur par défaut de deux. Sélectionnez ensuite une factorielle à degré.
Sélectionnez uniquement les facteurs sans mélange, puis sélectionnez Macros, Cubique partiel. Sélectionnez uniquement les facteurs de mélange, puis sélectionnez Macros, Scheffe Cubic. Désactivez l’option sans interception par défaut.
Spécifiez la colonne de réponse, remplacez la personnalité par Régression généralisée. Enregistrez ce modèle configuré dans la table de données pour faciliter le rappel. Sélectionnez Enregistrer dans la table de données.
Cliquez sur Exécuter. Pour Méthode d’estimation, sélectionnez SVEM Forward Selection (Sélection directe SVEM). Développez les menus Advanced Controls Force Terms et décochez les cases correspondant aux effets principaux du mélange.
Seul le terme Intercept restera coché. Cliquez sur Go.Tracez les réponses réelles en fonction de leurs réponses prévues à partir du modèle SVEM pour vérifier une prévisibilité raisonnable. Cliquez sur le triangle rouge en regard de SVEM Forward Selection (Sélection directe SVEM) et sélectionnez Save Columns, Save Prediction Formula (Enregistrer les colonnes, Save Prediction Formula).
Cela crée une nouvelle colonne contenant la formule de prédiction dans la table de données Répétez les étapes de création du modèle pour chaque réponse. Une fois que toutes les réponses ont des colonnes de prédiction enregistrées dans la table de données, tracez les traces de réponse pour toutes les colonnes de réponse prédites à l’aide d’une fonction de profileur. Sélectionnez Graph Profiler et sélectionnez toutes les colonnes de prédiction créées à l’étape précédente pour la formule de prédiction Y, puis cliquez sur OK.
Identifier les formulations optimales candidates. Définissez la fonction de désirabilité pour chaque réponse, qu’elle doive être maximisée, réduite ou adaptée à une cible. Cela implique également de définir les poids d’importance relative pour chaque réponse.
Pour générer le premier candidat, définissez toutes les réponses primaires pour utiliser le poids d’importance 1,0 et toutes les réponses secondaires pour utiliser le poids d’importance 0,2. Demandez au profileur de trouver les paramètres de facteur optimaux qui maximisent la fonction de désirabilité. Sélectionnez Désirabilité d’optimisation, Maximiser la désirabilité.
Notez les paramètres de facteur optimaux ainsi qu’une note sur les pondérations d’importance utilisées pour chaque réponse. Pour les facteurs catégoriques tels que le type de lipide ionisable, trouvez les formulations conditionnellement optimales pour chaque niveau de facteur. Tout d’abord, définissez le niveau souhaité de chaque facteur dans le profileur.
Maintenez ensuite la touche Contrôle enfoncée et faites un clic gauche à l’intérieur du graphique de ce facteur et sélectionnez Paramètre du facteur de verrouillage. Cette optimisation et désirabilité de sélection, maximise la désirabilité pour trouver l’optimum conditionnel avec ce facteur verrouillé dans son réglage actuel. Lorsque vous avez terminé, déverrouillez les paramètres de facteur avant de continuer.
Répétez le processus d’optimisation après avoir modifié les poids d’importance de la réponse, peut-être seulement en optimisant les réponses primaires ou en définissant certaines des réponses secondaires pour avoir plus ou moins de poids d’importance, en définissant leur objectif à aucun. Enregistrez le nouveau candidat optimal. Produire des résumés graphiques des régions optimales de l’espace factoriel.
Créez une table de données qui contient 50 000 lignes remplies avec des paramètres de facteurs générés aléatoirement dans l’espace factoriel autorisé, ainsi que les valeurs prédites correspondantes des modèles réduits pour chacune des réponses, ainsi que la fonction de désirabilité conjointe. Sélectionnez Table aléatoire de sortie. Définissez la valeur du nombre d’exécutions à simuler sur 50 000 et cliquez sur OK.
Dans la table nouvellement créée, ajoutez une nouvelle colonne qui calcule le percentile de la colonne de désirabilité. Utilisez cette colonne de centile dans les tracés ternaires au lieu de la colonne de désirabilité brute. Cliquez avec le bouton droit sur l’en-tête de colonne Désirabilité et sélectionnez Nouvelle colonne de formule, Distribution, Probabilité cumulée.
Générez les graphiques suivants. Modifiez à plusieurs reprises le jeu de couleurs des graphiques afin d’afficher les prédictions pour chaque réponse et pour la colonne de probabilité cumulée. Construire des diagrammes ternaires pour les quatre facteurs lipidiques.
Dans le tableau, accédez au graphique ternaire. Sélectionnez les facteurs de mélange pour le tracé X et cliquez sur OK. Cliquez avec le bouton droit sur l’un des graphiques obtenus, sélectionnez Légende de ligne, puis sélectionnez la colonne de réponse prévue.
Changez la liste déroulante des couleurs en Jet. Cela montrera les régions les plus performantes et les moins performantes en ce qui concerne les facteurs lipidiques. La figure actuelle montre les percentiles de la désirabilité conjointe lorsque l’on considère la maximisation de la puissance avec une suite importante à 1, et la minimisation de la taille avec une suite importante à la suite de 0,2.
Tout en faisant la moyenne sur tous les facteurs qui ne sont pas représentés sur l’axe du tracé ternaire. Modifiez à plusieurs reprises le jeu de couleurs des graphiques afin d’afficher les prédictions pour chaque réponse. De même, tracez les 50 000 points codés par couleur représentant des formulations uniques par rapport aux facteurs de processus sans mélange, singuliers ou conjoints, et recherchez les relations entre les réponses et les facteurs.
Recherchez les paramètres de facteur qui produisent le rendement en points le plus désirable. Cette figure montre l’intérêt conjoint de toutes les formulations qui pourraient être formées avec chacun des trois types de lipides ionisés. Les formulations les plus souhaitables utilisent H102, H101 fournissant des alternatives potentiellement compétitives.
Explorez différentes combinaisons de facteurs qui pourraient mener à différentes réponses. Enregistrez le profileur de prédiction et ses paramètres mémorisés dans la table de données. Préparez un tableau énumérant les candidats optimaux identifiés précédemment.
Incluez le contrôle de référence avec l’ensemble des essais candidats qui seront formulés et mesurés. Si l’une des formulations de l’expérience s’est avérée donner des résultats souhaitables, peut-être en surpassant le benchmark, sélectionnez la meilleure à ajouter au tableau candidat et testez à nouveau avec de nouvelles formulations. Cliquez avec le bouton droit sur le tableau des paramètres mémorisés dans le profileur et sélectionnez Créer en tableau de données.
Effectuez les cycles de confirmation, construisez les formulations et rassemblez les lectures. Comparez les performances des formulations optimales candidates. Le flux de travail a été utilisé dans de nombreuses applications.
Dans la plupart des cas, nous avons observé une amélioration de la puissance au moins quatre à cinq fois lorsque nous comparons les formulations de référence qui ont été définies en utilisant une optimisation de facteur à la fois. Les améliorations sont particulièrement perceptibles lorsque les réponses secondaires sont ciblées conjointement. Il est également possible d’utiliser la simulation pour montrer la qualité attendue des candidats optimaux produits par cette procédure.
En utilisant une fonction de génération de données connue pour l’exemple d’expérience décrit dans l’article, nous pouvons comparer la qualité des formulations optimales candidates obtenues à partir des conceptions de remplissage d’espace et de l’analyse SVEM utilisées dans ce flux de travail à celles obtenues à partir des techniques traditionnelles d’analyse de mélange. Avec la qualité de la formulation optimale indiquée sur l’axe vertical et le nombre d’essais dans la conception indiqué sur l’axe horizontal, les points bleus représentent la performance du modèle statistique complet non réduit sur 150 simulations. Les points orange représentent la performance de la sélection traditionnelle d’un seul tir vers l’avant basée sur la fonction d’objectif AICC.
Les points verts représentent les performances de l’approche de sélection directe basée sur SVEM utilisée dans ce flux de travail. L’analyse SVEM nous permet d’obtenir de meilleurs candidats optimaux et moins de courses. Il y aura des études occasionnelles avec une complexité supplémentaire qui nécessitent l’aide d’un statisticien pour la conception et l’analyse.
Les études extrêmement prioritaires, dont la taille de l’exécution est plus limitée que d’habitude, ou où il existe un grand nombre de facteurs catégoriels, ou un facteur catégorique unique avec un grand nombre de niveaux peuvent être abordées différemment par un statisticien. Utilisation de conceptions optimales ou hybrides à la place de la conception de remplissage d’espace spécifiée dans le flux de travail.