La importancia de este manuscrito experimental radica en las aplicaciones de la espectroscopia de infrarrojo cercano y los algoritmos de minería de datos para el monitoreo en línea de la industria de procesos real. Las mayores ventajas de esta tecnología residen en su rapidez. La propiedad no destructiva de su tecnología de detección de infrarrojo cercano y la práctica de mínimos cuadrados parciales, o PLS, algoritmo.
Para comenzar, conecte el espectrómetro como se describe en el protocolo de texto. Para configurar parámetros de medición, utilice el software OPUS. Vaya al menú Medir y seleccione el comando Medición avanzada.
En el cuadro de diálogo que se abre, defina los parámetros de medición en las diferentes fichas. Para almacenar el archivo de experimento, haga clic en la ficha Avanzadas. Defina la resolución como cuatro centímetros inversos.
Defina el número de exploraciones como 16 exploraciones en los campos de entrada de tiempo de análisis en segundo plano de muestra. Defina la ruta para almacenar automáticamente los datos de medición de 4.000 centímetros inversos a 12.500 centímetros inversos. Determine el tipo de datos para el espectro de resultados como absorbancia y guarde el archivo de experimento.
Ahora haga clic en la pestaña Óptica. Haga clic en la lista desplegable de configuración de apertura y seleccione el mismo valor utilizado para adquirir un espectro de muestra. A continuación, haga clic en la pestaña Básico.
Haga clic en el botón De fondo canal único y coloque la muestra en la ruta óptica del espectrómetro para medir el espectro de muestra. Defina la descripción de ejemplo y el formulario de muestra en el campo de entrada en particular. Esta información se almacena junto con el espectro.
Ahora haga clic en el botón Sample Single Channel (Ejemplo de canal único) para iniciar la medición en línea. Guarde el espectro NIR de cada escaneo como un archivo OPUS. Utilice el software OPUS para leer el conjunto espectral original.
En el menú Archivo, haga clic en el comando Cargar archivo. En el cuadro de diálogo que se abre, seleccione el archivo de espectro en particular. Haga clic en el botón Abrir.
El espectro se muestra en la ventana de espectro. Con la función de preprocesamiento espectral en, obtenga el conjunto de datos espectrales preprocesado con la derivada de primer orden. Primero abra el Unscrambler, que es un software de análisis de datos multivariante y diseño experimental.
A continuación, seleccione el comando Importar en Archivo. Importe el archivo OPUS como un dataset espectral NIR original. Seleccione el comando Transformar en Modificar.
A continuación, seleccione los derivados de Savitzky-Golay en Derivados. Defina los ejemplos y variables como todos los ejemplos y todas las variables en scope. También defina el número de puntos de suavizado como 13 y la derivada como primera derivada en Parámetros.
Haga clic en Aceptar para iniciar la derivada. Realice la normalización vectorial en los espectros de la muestra para normalizar el valor de la absorbancia. Seleccione el comando de normalización en Modificar.
Defina los ejemplos y variables como todos los ejemplos y todas las variables en scope. Seleccione la normalización vectorial en el tipo. Haga clic en Aceptar para realizar la normalización vectorial.
Para seleccionar el número adecuado de componentes principales, abra MATLAB e importe el archivo MAT que contiene los datos espectrales de infrarrojo cercano preprocesados arrastrando el archivo MAT al espacio de trabajo. Abra el archivo M programado en el editor. Haga clic en Abrir en la opción Editor, seleccione el archivo M compilado en el directorio de almacenamiento de archivos y, a continuación, haga clic en Confirmar.
Trabajar en MATLAB para extraer 15 componentes principales según el objetivo de optimización y el modelo OLSR entre los componentes principales extraídos y los valores predichos de la concentración de O-cresol. Determine los valores R cuadrados y la tendencia con el número creciente de componentes principales. Seleccione 10 como el número adecuado de componentes principales con el valor R cuadrado de 0,9917.
Para validar la bondad del ajuste y la precisión del modelo PLSR, repita el proceso de modelado con 10 componentes principales. Evalúe el modelo basándose en una validación cruzada de 10 veces utilizando las gráficas de la varianza porcentual explicada en los datos espectrales NIR, los residuos y el error de predicción cuadrada media de validación cruzada o MSPECV. Aquí se trazan los residuos, que hacen referencia a la diferencia entre el valor de referencia de contenido de O-cresol y la estimación del modelo PLSR.
Los datos trazados muestran que PLSR para la medición del contenido de O-cresol basado en los datos espectrales NIR tiene una alta precisión. El error cuadrado medio de validación cruzada es una medida del grado de diferencia entre la referencia y el contenido de O-cresol predicho. Cuanto menor sea el valor, mejor será la precisión del modelo predictivo que describe el contenido de O-cresol.
El error de predicción cuadrada media de validación cruzada para la medición de concentración de O-cresol basada en el PLSR disminuye a medida que aumenta el número de componentes principales. El error alcanza un mínimo aceptable en 10 componentes principales. Esto demuestra que el PLSR da como resultado una alta estabilidad para la medición de la concentración de O-cresol utilizando NIRS.
Al intentar este procedimiento, el paso más importante es obtener con precisión los valores de referencia de las composiciones porque esta es la base para todo el preprocesamiento y el modelado realizado en la etapa posterior. Además de PLS, algunos algoritmos de aprendizaje automático populares actuales, como el aprendizaje profundo y el árbol de decisiones, también se pueden utilizar en este procedimiento. En combinación con la tecnología de detección NIRS, creemos que la minería de datos propuesta es una plantilla significativa para su aplicación en el proceso de automatización industrial a la transformación inteligente en la industria moderna.