本实验手稿的意义在于近红外光谱学和数据挖掘算法在实际工艺工业的在线监测中的应用。这项技术的最大优点在于其速度。其近红外检测技术无损性能,以及部分最少平方(PLS)算法的实践。
首先,连接光谱仪,如文本协议中所述。要设置测量参数,请使用 OPUS 软件。导航到"测量"菜单,然后选择"高级测量"命令。
在打开的对话框中,定义不同选项卡上的测量参数。要存储实验文件,请单击"高级"选项卡。将分辨率定义为四个反厘米。
在示例后台扫描时间输入字段中将扫描数定义为 16 次扫描。定义自动存储测量数据路径,从 4,000 个逆厘米存储到 12,500 个逆厘米。确定结果频谱的数据类型为吸收度,并保存实验文件。
现在单击"光学"选项卡。单击光圈设置下拉列表,然后选择用于获取样本光谱的相同值。然后单击"基本"选项卡。
单击"背景单通道"按钮,将样品放入光谱仪的光路以测量样品光谱。在特定条目字段中定义示例描述和示例窗体。此信息与频谱一起存储。
现在单击"示例单通道"按钮开始联机测量。将每次扫描的 NIR 频谱另存为 OPUS 文件。使用软件 OPUS 读取原始光谱集。
在"文件"菜单上,单击"加载文件"命令。在打开的对话框中,选择特定的频谱文件。单击"打开"按钮。
频谱显示在频谱窗口中。具有光谱预处理功能,获取具有一阶导数预处理的频谱数据集。首先打开解刮器,这是一个多变量数据分析和实验设计软件。
然后在"文件"下选择"导入"命令。将 OPUS 文件作为原始 NIR 光谱数据集导入。在"修改"下选择"转换"命令。
然后选择衍生工具下的萨维茨基-戈莱衍生工具。将示例和变量定义为范围中的所有示例和所有变量。还要将平滑点数定义为 13,将导数定义为参数中的第一个导数。
单击"确定"以启动导数。对样品光谱执行矢量归一化,使吸收度值正常化。在"修改"下选择规范化命令。
将示例和变量定义为范围中的所有示例和所有变量。在类型中选择矢量规范化。单击"确定"以执行矢量规范化。
要选择适当数量的主要组件,请打开 MATLAB,然后通过将 MAT 文件拖动到工作空间来导入包含预处理近红外光谱数据的 MAT 文件。打开编辑器中的编程 M 文件。单击"编辑器"选项下的"打开",在文件存储目录中选择已编译的 M 文件,然后单击"确认"。
在 MATLAB 中,根据提取的主要成分和 O-cresol 浓度的预测值之间的优化目标和 OLSR 模型提取 15 个主要成分。确定 R 平方值和趋势,主体组件数量不断增加。选择 10 作为 R 平方值为 0.9917 的合适数量的主要组件。
为了验证 PLSR 模型的拟合和精度,请使用 10 个主要组件重复建模过程。使用 NIR 光谱数据中解释的百分比方差的绘图、残差和交叉验证或 MSPECV 的均方预测误差,根据 10 倍交叉验证评估模型。此处绘制的残差是指 O-cresol 含量参考值与 PLSR 模型估计值之间的差值。
绘制的数据表明,基于NIR光谱数据的O-cresol含量测量的 PLSR具有很高的精度。交叉验证均方误差是参考值与预测 O-cresol 含量差度的度量。值越小,描述 O-cresol 含量的预测模型的准确性越高。
基于 PLSR 的 O-cresol 浓度测量交叉验证的均方形预测误差随着主要成分数量的增加而减小。误差在 10 个主要组件时达到可接受的最小值。这证明,PLSR在利用NIRS测量O-cresol浓度时具有高稳定性。
在尝试此过程时,最重要的步骤是准确获取合成的参考值,因为这是在后期阶段执行的所有预处理和建模的基础。除了 PLS 之外,一些当前流行的机器学习算法(如深度学习和决策树)也可用于此过程。结合NIRS检测技术,我们认为,建议的数据挖掘是工业自动化在现代工业智能转型过程中应用的重要模板。