JoVE Logo

登录

需要订阅 JoVE 才能查看此. 登录或开始免费试用。

本文内容

  • 摘要
  • 摘要
  • 引言
  • 研究方案
  • 结果
  • 讨论
  • 披露声明
  • 致谢
  • 材料
  • 参考文献
  • 转载和许可

摘要

该协议描述了一种使用近红外光谱和部分最小二乘回归预测聚苯醚生产过程中o-cresol浓度的方法。为了更清晰、更全面地描述过程,使用一个预测聚苯乙烯生产过程中的o-cresol浓度的例子来阐明这些步骤。

摘要

与宏观过程变量不同,近红外光谱在分子水平上提供过程信息,并可以显著提高工业过程中组件的预测。无需任何预处理即可记录固体和液体样品的光谱,这种方法应用广泛。然而,分析高维近红外光谱数据的缺点包括信息冗余和光谱数据的多共线性。因此,我们建议使用部分最小二乘回归方法,该方法传统上用于减小数据维数,消除原始要素之间的共线性。实现聚苯醚生产过程中o-cresol浓度的预测方法。与分量回归预测方法不同,该方法具有以下优点:1) 部分最小二乘回归解决了独立变量的多共线性问题,并有效地避免了在由于独立变量之间的相关性高,回归分析;2) 近红外光谱的使用可以产生高精度,因为它是一种无损和无污染的方法,用于在微观和分子尺度上获得信息。

引言

近红外(NIR)光谱学(NIRS)作为一种快速、高效、无损、无污染的现代分析技术,已得到广泛接受;该方法在过去几年中已用于工业过程中的产品质量检测和分析以及化学成分测量。该方法最重要的特点是能够记录固体和液体样品的光谱,无需任何预处理,使NIRS特别适用于直接和快速检测和分析天然和合成产品1,2。与在宏观尺度上测量过程变量(如温度、压力、液位等)并不可避免地受到外部噪声和背景干扰的传统传感器不同,NIRS 在微观和分子尺度上检测化学成分的结构信息。因此,与其他方法3,4相比,可以更准确、更有效地测量基本信息。

聚苯醚作为工程塑料之一,由于其耐热性、阻燃性、绝缘性、电气性能、尺寸稳定性、抗冲击性、抗蠕变性、机械强度等特性而得到广泛应用。更重要的是,与其他工程塑料相比,它是无毒无害的。目前,2,6-xylenol是聚苯醚合成的基本原料之一,通常采用甲醇法6制备苯酚催化烷基化。这种制备方法有两种主要产品,o-cresol和2,6-xylenol。经过一系列的分离和提取步骤,2,6 xylenol用于生产聚苯醚。然而,微量的o-cresol仍然留在2,6-xylenol中。O-cresol 不参与聚苯醚的合成,并将留在聚苯醚产品中,导致产品质量下降,甚至不合格。目前,大多数公司仍在通过物理或化学分离分析(如色谱7、8)分析含有杂质的液相聚苯醚产品等复杂有机混合物的成分。色谱分离原理是使用组合物的混合物在固定相和流动阶段中的溶解、分析、吸附、解吸或其他亲和力的细微差异,在性能上。当两个阶段相对移动时,组合在两个阶段中反复由上述操作分隔。根据对象的不同,完成复杂的材料分离操作通常需要几分钟到几十分钟。可以看出,测量效率低。

目前,基于这一分析的产品质量测量和先进的控制技术是进一步提高产品质量的关键方向。在聚苯醚生产加工工业中,对聚苯醚产品中的o-cresol含量进行实时测量具有重要的开发意义。色谱分析显然不能满足高级控制技术对实时测量物质和信号反馈的要求。因此,我们提出了部分最小二乘回归(PLSR)方法,在NIRS数据与o-cresol浓度之间建立线性模型,实现了出口液聚苯醚产品中o-cresol含量的在线测量.

在多变量统计建模之前,NIRS 的预处理起着最重要的作用。NIRS波数在NIR光谱和生物样品的颗粒大小是可比的,所以它被称为意外的散射效应,对记录的样品光谱有影响。通过执行适当的预处理方法,这些影响很容易消除,基本上9。NIRS中最常用的预处理技术分为散射校正和光谱导数方法。第一组方法包括乘法散射校正、去趋势、标准法向变量变换和规范化。光谱推导方法包括使用第一和第二导数。

在开发定量回归模型之前,从 NIRS 数据中删除非系统的散点变化非常重要,因为它们对预测模型的准确性、复杂性和简洁性有显著影响。选择合适的预处理方法应始终取决于后续的建模步骤。在这里,如果 NIR 光谱数据集不遵循 Lambert-Beer 定律,则其他因素往往会补偿预测组件的非理想行为。存在这些不必要因素的缺点是导致模型复杂性的增加,甚至很可能降低鲁棒性。因此,光谱导数的应用和对光谱数据的常规规范化是该方法的重要组成部分。

经过光谱预处理,获得高信噪比和低背景干扰的NIRS数据。现代 NIRS 分析可在适当的光谱范围内快速获得大量吸收。然后,通过使用光谱曲线中包含的信息提取相关变量来预测样品的化学成分。一般来说,NIRS与多变量分析技术相结合,用于定性或定量分析10。多变量线性回归(MLR)分析通常用于开发和挖掘工业过程中数据与组件之间的数学关系,并在NIRS分析中得到了广泛的应用。

但是,在为预处理的 NIRS 数据实施 MLR 时,存在两个基本问题。一个问题是可变冗余。NIRS 数据的高维数通常使因变量的预测不可靠,因为包含的变量与组件无关。这些冗余变量降低了光谱数据的信息效率,影响了模型的精度。为了消除可变冗余,必须开发和最大化 NIRS 数据与预测组件之间的相关性。

另一个问题是NIRS数据中的多共线性问题。多个线性回归模型的重要假设之一是回归模型的任何解释变量之间没有线性关系。如果存在这种线性关系,则证明线性回归模型中存在多共线性,并违反了该假设。在多个线性回归(如普通最小二乘回归 (OLSR))中,变量之间的多重相关性会影响参数估计,增加模型误差,并影响模型的稳定性。为了消除近红外光谱数据之间的多线性相关性,我们使用可变选择方法,使样本的固有变异性最大化。

在这里,我们建议使用PLSR,这是多线性回归的概括,已广泛应用于NIRS11,12领域。PLSR整合了MLR的基本功能、规范的相关分析(CCA)和主要成分分析(PCA),并将预测分析与非模型数据内涵分析相结合。PLSR 可以分为两部分。第一部分通过部分最小二乘分析(PLS)选择特征变量和预测分量的分量。PLS 通过在提取主组件时使主组件和预测组件的协方差尽可能大,从而最大化主要组件的固有变异性。接下来,为所选的主要成分建立O-cresol浓度的OLSR模型。PLSR 适用于分析具有大量强共线性和高度相关的独立变量的噪声数据,以及同时建模多个响应变量。此外,PLSR提取了样品光谱的有效信息,克服了多共线性问题,具有稳定性强、预测精度高的优点13、14。

以下协议描述了使用 PLSR 模型使用近地红外光谱数据测量 o-cresol 浓度的过程。利用确定系数()、figure-introduction-2905预测相关系数()figure-introduction-2978和交叉验证(MSPECV)的均方预测误差对模型的可靠性和准确性进行了定量评价。此外,为了直观地展示 PLSR 的优点,评估指标在几个图中可视化,以便进行定性分析。最后,以表格式给出了实验的评价指标,定量说明了PLSR模型的可靠性和精度。

研究方案

1. 使用傅立叶变换(FT)-NIR工艺光谱仪进行NIR频谱数据采集

  1. 在聚苯醚产品出口处安装近红外光谱仪的液相光纤探头。打开连接到仪器的上部计算机上的OPUS软件,并开始配置测量。
  2. 连接到光谱仪
    1. 在"测量"菜单上,选择"光学设置和服务"命令,或单击工具栏中的图标。
    2. 在打开的对话框中,单击"光学工作台"选项卡
    3. 检查光谱仪设置是否正常。如果是,则关闭对话框。如果没有,请继续执行步骤 4。
    4. 从"配置"下拉列表中,选择特定的光谱仪类型。
    5. 将光谱仪的 IP 地址输入光学工作台 URL条目字段。
    6. 单击"连接"按钮。
  3. 设置测量参数
    1. 在"测量"菜单上,选择"测量"命令,或单击工具栏中的图标。
    2. 在打开的对话框中,定义不同选项卡上的测量参数。
      注:有关各个测量参数的详细信息见 OPUS 参考手册。
    3. 单击"接受和退出"按钮。
  4. 存储实验文件
    1. 在"测量"菜单上,选择"高级测量"命令。然后,单击"高级"选项卡。
    2. 在打开的对话框上,将分辨率定义为4 厘米-1
    3. 在"采样/后台扫描时间"条目字段中将扫描数定义为16次扫描。
    4. 定义自动存储4,000 cm-1-12,500 cm-1的测量数据的路径。
    5. 确定结果频谱的数据类型为吸收。
    6. 单击"保存"按钮。
    7. 在打开的对话框中,为实验文件定义名称并保存此名称。
  5. 测量背景频谱
    1. 在"测量"菜单上,选择"高级测量"命令。
    2. 单击"光学"选项卡。
    3. 在打开的对话框中,单击Aperture 设置下拉列表,然后选择用于获取样本频谱的相同值。
    4. 单击"基本"选项卡。
    5. 在打开的对话框中,单击"后台单通道"按钮。
  6. 测量样品光谱
    1. 将样品放入光谱仪的光学路径中。完成此操作的方式取决于光谱仪配置。
    2. 在"测量"菜单上,选择"高级测量"命令。
    3. 单击"基本"选项卡。
    4. 在打开的对话框中,在特定条目字段中定义示例说明和示例窗体。此信息与频谱一起存储。
    5. 单击"单通道示例"按钮开始联机测量。并保存每个扫描的NIR频谱作为OPUS文件。
  7. 每6小时采集一次聚苯乙烯样品,在工业实验室用液相色谱法对o-cresol浓度进行检测,以获得化学参考价值。
    注:工业领域的实验室工作人员从液相聚苯醚的出口中抽取每个聚苯醚样品。通过液相色谱测量每个样品中的o-cresol含量三次。然后,将三次分析结果的平均值作为o-cresol含量的参考值,以减少意外误差。
  8. 在实验室中获得600个o-cresol浓度的化学参考值。o-cresol浓度的校准范围为42.1063mg/1 g多苯醚产品至51.6763mg/1 g多苯醚产品。
  9. 在给定测试时间将 NIR 光谱与 o-cresol 浓度的化学参考值相结合。
  10. 使用软件 OPUS 读取原始光谱集,如图1所示。
    1. 在"文件"菜单上,单击"加载文件"命令。
    2. 在打开的对话框中,选择特定的频谱文件。
    3. 单击"打开"按钮。频谱显示在频谱窗口中。

2. 近红外光谱数据预处理

  1. 使用光谱预处理函数,获取用一阶导数预处理的光谱数据集。
    1. 打开多变量数据分析和实验设计软件的"解扰器",在"文件"选择"导入"命令。将 OPUS 文件导入为原始近地红外光谱数据集。
    2. 在"修改"选择"变换"命令。并在衍生产品下选择萨维茨基戈莱衍生工具。
    3. 将样本和变量定义为作用域中的所有样本和所有变量。在参数中,将平滑点数定义为13,导数定义为第 1导数。
    4. 单击"确定"以启动导数。
      注意:平滑度的增加可以减少曲线的剧烈波动,降低噪声效应,同时削弱曲线的特性,使曲线变形。因此,根据对曲线实际波动强度的观察和加工后的效果,选择适当的平滑度。
  2. 对样品光谱执行矢量规范化,以规范化吸收值。
    1. 在"修改"选择"规范化"命令。
    2. 样本和变量定义为作用域中的所有样本和所有变量。
    3. 在"类型"中选择矢量规范化。
    4. 单击"确定"以执行矢量规范化。

3. 建立PLSR模型

  1. 创建近地红外光谱数据集
    1. 打开无克的.exe,选择"使用Matlab文件在文件导出"以将预处理的光谱数据集导出到 .mat File,并自动使用 2203 变量获取光谱数据集 X。
    2. 以 .mat 文件的形式获取完整的近地红外光谱数据集 X(600 行和 2203 列的矩阵)和相应的化学参考值 Y(600 行的矢量),以便进行后续分析和建模。
  2. 选择适当数量的主要组件
    1. 打开Matlab,通过将 .mat 文件拖动到工作区,将包含预处理的近红外光谱数据 .mat 文件导入工作区。
      注:.mat 文件将近红外光谱数据 X 存储为独立变量,以两个矩阵的形式将产品的 o-cresol 内容存储为因变量。
    2. 编辑器中打开已编程的 .m 文件。单击"编辑器"选项下的"打开",在文件存储目录中选择已编译的 .m 文件,然后单击"确认"。
    3. 根据公式1的优化目标和提取的主要分量之间的OLSR模型提取15个主分量,并在Matlab中包含命令plsregress()的程序提取o-cresol浓度的预测值。
      [XL、YL、XS、YS、BETA、PCTVAR、MSE]=pls回归(X、Y、ncomp、'CV'、k);
      请参阅 MATLAB 帮助文档以获取使用详细信息和返回值。
      注:figure-protocol-4246公式1 figure-protocol-4349
      figure-protocol-4418,是figure-protocol-4485近地红外光谱数据的主要组成部分;
      figure-protocol-4590是近地红外光谱数据第二主要成分的投影;
      figure-protocol-4698I主要组分和 o-cresol 浓度的皮尔逊相关系数。
    4. 使用figure-protocol-4825公式2获取近红外光谱数据的值和不同主分量的预测值。
      注:figure-protocol-4938公式2
      figure-protocol-5027是因误差而起的平方和,定义为figure-protocol-5108;
      figure-protocol-5180是平方的总和,定义为figure-protocol-5257;
      figure-protocol-5329是测试数据集o-cresol浓度的参考值;
      figure-protocol-5421是测试数据集o-cresol浓度的预测值;
      figure-protocol-5513是测试数据集o-cresol浓度的参考值平均值;
      figure-protocol-5608是测试数据集的样本数。
    5. 确定figure-protocol-5700值和趋势与越来越多的主要组件,如图2所示。选择 10 作为figure-protocol-5824值为 0.9917 的相应数量的主要组件。
      注:figure-protocol-5916值是因变量中由独立变量可预测的方差比例。figure-protocol-6003值越高,拟合优度越高,反之亦然。
  3. 使用命令 plsregress() 验证使用10个主组件的 PLSR 模型的拟合优度和准确性。
    1. 使用 10 个主要组件作为步骤 3.2.1-3.2.5 使用 10 个主要组件重复建模过程。
    2. 使用近红外光谱数据、残差和 MSPECV 中解释的百分比方差图,基于 10 倍交叉验证评估模型。
    3. 将近地红外光谱数据、残差和 MSPECV 中解释的百分比方差绘制为图 3、45。
    4. 列出 PLSR 模型figure-protocol-6424figure-protocol-649010 倍交叉验证的 、 和 MSPE 的评估指标,以便进行定量分析,如表 1所示。
      注: 和 MSPE 的figure-protocol-6628方程显示为方程3和方程4
      figure-protocol-6744公式 3
      figure-protocol-6819公式 4
      figure-protocol-6894是o-cresol浓度的参考值和预测值的协方差;figure-protocol-6985是o-cresol浓度参考值的标准偏差;
      figure-protocol-7076是 o-cresol 浓度预测值的标准偏差。

结果

基于PLSR的近红外光谱获得了多苯醚产品中o-cresol杂质的预测值。图2图3分别从决策系数曲线和误差解释百分比随主分量数量增加的要素选择阶段显示了该方法的可靠性。

具体来说,请注意,在选择主要组件时,为了最小化模型的复杂性,通常,当两个指标没有随着主要元素的数量显著增加时,可以?...

讨论

该协议描述了在使用NIRS的聚苯醚液体产物中残留的o-cresol浓度测量PLSR的过程。

这个过程的两个关键步骤是原始近地红外光谱数据的预处理和高维近地红外光谱数据的变量选择。

一般来说,非系统背景干扰导致近红外光谱的非系统散射偏差或基线漂移。正确的近红外光谱预处理方法(导数、规范化、多变量散射校正等)作为第一个关键步骤,消除了背景?...

披露声明

作者没有什么可透露的。

致谢

这项工作得到了国家自然科学基金(第61722306号、61473137号)和国家轻工业技术与工程一级学科项目(LITE2018-025)的支持。

材料

NameCompanyCatalog NumberComments
MPA II Multi Purpose FT-NIR AnalyzerBruker1
Fiber Optic Probes(Liquid phase)Bruker1
Liquid chromatography analyzer /1
Laboratory Equipment and Supplies(e.g. test tube, etc.)/
MATLABMathWork1
OPUSBruker1
Principal computerDELL1
The UnscramblerCAMO1

参考文献

  1. Nicolai, B. M., et al. Nondestructive measurement of fruit and vegetable quality by means of NIR spectroscopy: A review. Postharvest Biology and Technology. 46 (2), 99-118 (2007).
  2. Chang, C. W., Laird, D. A., Mausbach, M. J., Hurburgh, C. R. Near-infrared reflectance spectroscopy-principal components regression analyses of soil properties. Soil Science Society of America Journal. 65 (2), 480-490 (2001).
  3. Chen, Y., et al. Near-infrared spectroscopy for rapid evaluation of different processing products of Sophora japonica. L. Spectroscopy Letters. 51 (1), 37-44 (2018).
  4. Cayuela, J. A., Garcia, J. F. Nondestructive measurement of squalene in olive oil by near infrared spectroscopy. LWT-FOOD SCIENCE AND TECHNOLOGY. 88, 103-108 (2018).
  5. Joaquim, M., Rudnick, R. L., Shubkin, R. L. Polyphenyl Ether Lubricants. Synthetic Lubricants and High-performance Functional. , 239 (1999).
  6. Grabowska, H., Kaczmarczyk, W., Wrzyszcz, J. Synthesis of 2,6-Xylenol by Alkylation of Phenol with Methanol. Applied Catalysis. 47 (2), 351-355 (1989).
  7. Jeon, D. B., et al. Determination of volatile organic compounds, catechins, caffeine and theanine in Jukro tea at three growth stages by chromatographic and spectrometric methods. FOOD CHEMISTRY. 219, 443-452 (2016).
  8. Davidyuk, E. I., Demchenko, V. F., Klisenko, M. A. Rapid group separation and identification of chlorinated organic compounds by high performance liquid chromatography. JOURNAL OF ANALYTICAL CHEMISTRY. 52 (11), 1058-1065 (1997).
  9. Rinnan, A., Berg, F., Engelsen, S. B. Review of the most common pre-processing techniques for near-infrared spectra. TrAC Trends in Analytical Chemistry. 28 (10), 1201-1222 (2009).
  10. Zou, X. B., Zhao, J. W., Povey, M. J. W., Holmes, M., Mao, H. P. Variables selection methods in near-infrared spectroscopy. Analytica Chimica Acta. (1-2), 14-32 (2010).
  11. Dunn, B. W., Beecher, H. G., Batten, G. D., Ciavarella, S. The potential of near-infrared reflectance spectroscopy for soil analysis - a case study from the Riverine Plain of south-eastern Australia. Australian Journal of Experimental Agriculture. 42 (5), 607-614 (2002).
  12. Wang, C. K., Zhang, T. L., Pan, X. Z. Potential of visible and near-infrared reflectance spectroscopy for the determination of rare earth elements in soil. Geoderma. 306, 120-126 (2017).
  13. Gatius, F., Miralbes, C., David, C., Puy, J. Comparison of CCA and PLS to explore and model NIR data. Chemometrics and Intelligent Laboratory Systems. , 76-82 (2017).
  14. Wold, S., Sjostrom, M., Eriksson, L. PLS-regression: a basic tool of chemometrics. Chemometrics & Intelligent Laboratory. 58 (2), 109-130 (2001).
  15. Douglas, R. K., Nawar, S., Alamar, M. C., Mouazen, A. M., Coulon, F. Rapid prediction of total petroleum hydrocarbons concentration in contaminated soil using vis-NIR spectroscopy and regression techniques. SCIENCE OF THE TOTAL ENVIRONMENT. 616, 147-155 (2017).
  16. Grassi, S., Alamprese, C. Advances in NIR spectroscopy applied to process analytical technology in food industries. CURRENT OPINION IN FOOD SCIENCE. 22 (SI), 17-21 (2018).
  17. Trung, T., Downes, G., Meder, R., Allison, B. Pulp mill and chemical recovery control with advanced analysers - from trees to final product. APPITA. 68 (1), 39-46 (2015).
  18. Vann, L., Sheppard, J. Use of near-infrared spectroscopy (NIRs) in the biopharmaceutical industry for real-time determination of critical process parameters and integration of advanced feedback control strategies using MIDUS control. Journal of Industrial Microbiology& Biotechnology. 44 (12), 1589-1603 (2017).
  19. Modrono, S., Soldado, A., Martinez-Fernandez, A., de la Roza-Delgado, B. Handheld NIRS sensors for routine compound feed quality control: Real time analysis and field monitoring. TALANTA. 162, 597-603 (2017).

转载和许可

请求许可使用此 JoVE 文章的文本或图形

请求许可

探索更多文章

153 O cresol

This article has been published

Video Coming Soon

JoVE Logo

政策

使用条款

隐私

科研

教育

关于 JoVE

版权所属 © 2025 MyJoVE 公司版权所有,本公司不涉及任何医疗业务和医疗服务。