Se requiere una suscripción a JoVE para ver este contenido. Inicie sesión o comience su prueba gratuita.
Method Article
* Estos autores han contribuido por igual
El presente estudio empleó U-Net y otros algoritmos de aprendizaje profundo para segmentar una imagen de lengua y comparó los resultados de segmentación para investigar la objetivación del diagnóstico de lengua.
El diagnóstico de la lengua es una técnica esencial del diagnóstico de la medicina tradicional china (MTC), y la necesidad de objetivar las imágenes de la lengua a través de la tecnología de procesamiento de imágenes está creciendo. El presente estudio proporciona una visión general del progreso realizado en la objetivación de la lengua durante la última década y compara los modelos de segmentación. Se construyen varios modelos de aprendizaje profundo para verificar y comparar algoritmos utilizando conjuntos de imágenes de lengua reales. Se analizan las fortalezas y debilidades de cada modelo. Los hallazgos indican que el algoritmo U-Net supera a otros modelos con respecto a la precisión de precisión (PA), el recuerdo y la intersección media sobre las métricas de unión (MIoU). Sin embargo, a pesar del progreso significativo en la adquisición y procesamiento de imágenes de la lengua, aún no se ha establecido un estándar uniforme para objetivar el diagnóstico de la lengua. Para facilitar la aplicación generalizada de imágenes de lengua capturadas utilizando dispositivos móviles en la objetivación del diagnóstico de lengua, la investigación adicional podría abordar los desafíos planteados por las imágenes de lengua capturadas en entornos complejos.
La observación de la lengua es una técnica ampliamente utilizada en la medicina étnica tradicional china (MTC). El color y la forma de la lengua pueden reflejar la condición física y diversas propiedades de la enfermedad, severidades y pronósticos. Por ejemplo, en la medicina tradicional hmong, el color de la lengua se utiliza para identificar la temperatura corporal, por ejemplo, una lengua roja o púrpura indica factores patológicos relacionados con el calor. En la medicina tibetana, una condición se juzga observando la lengua de un paciente, prestando atención al color, la forma y la humedad del moco. Por ejemplo, las lenguas de los pacientes con enfermedad de Heyi se vuelven rojas y ásperas o negras y secas1; los pacientes con enfermedad de Xieri2 tienen la lengua amarilla y seca; mientras tanto, los pacientes con enfermedad de Badakan3 tienen una lengua blanca, húmeda y suave4. Estas observaciones revelan la estrecha relación entre las características de la lengua y la fisiología y la patología. En general, el estado de la lengua juega un papel vital en el diagnóstico, la identificación de la enfermedad y la evaluación del efecto del tratamiento.
Al mismo tiempo, debido a las diversas condiciones de vida y prácticas dietéticas entre los diferentes grupos étnicos, las variaciones en las imágenes de la lengua son evidentes. El modelo Lab, establecido sobre la base de un estándar internacional para la determinación del color, fue formulado por la Commission International Eclairage (CIE) en 1931. En 1976, un patrón de color fue modificado y nombrado. El modelo de color Lab se compone de tres elementos: L corresponde al brillo, mientras que a y b son dos canales de color. a incluye colores de verde oscuro (valor de brillo bajo) a gris (valor de brillo medio) a rosa brillante (valor de brillo alto); b va de azul brillante (valor de brillo bajo) a gris (valor de brillo medio) a amarillo (valor de brillo alto). Al comparar los valores L x a x b del color de la lengua de cinco grupos étnicos, Yang et al.5 encontraron que las características de las imágenes de la lengua de los grupos Hmong, Hui, Zhuang, Han y Mongol eran significativamente distintas entre sí. Por ejemplo, los mongoles tienen lenguas oscuras con una capa de lengua amarilla, mientras que los hmong tienen lenguas claras con una capa de lengua blanca, lo que sugiere que las características de la lengua pueden usarse como un indicador de diagnóstico para evaluar el estado de salud de una población. Además, las imágenes de la lengua pueden funcionar como un índice de evaluación para la medicina basada en la evidencia en la investigación clínica de la medicina étnica. He et al.6 emplearon imágenes de la lengua como base para el diagnóstico de la MTC y evaluaron sistemáticamente la seguridad y eficacia de los gránulos de Chou-Ling-Dan (gránulos de EPC utilizados para tratar enfermedades inflamatorias y febriles, incluida la gripe estacional en la MTC) combinados con la medicina china y occidental. Los resultados establecieron la validez científica de las imágenes de la lengua como índice de evaluación para estudios clínicos. Sin embargo, los médicos tradicionales generalmente confían en la subjetividad para observar las características de la lengua y evaluar las condiciones fisiológicas y patológicas de los pacientes, lo que requiere indicadores más precisos.
La aparición de Internet y la tecnología de inteligencia artificial ha allanado el camino para digitalizar y objetivar el diagnóstico de la lengua. Este proceso implica el uso de modelos matemáticos para proporcionar una descripción cualitativa y objetiva de las imágenes de la lengua7, reflejando el contenido de la imagen de la lengua. El proceso incluye varios pasos: adquisición de imágenes, compensación óptica, corrección de color y transformación geométrica. Las imágenes preprocesadas se introducen en un modelo algorítmico para el posicionamiento y segmentación de imágenes, extracción de características, reconocimiento de patrones, etc. El resultado de este proceso es un diagnóstico altamente eficiente y preciso de los datos de imágenes de la lengua, logrando así el objetivo de objetivación, cuantificación e informatización del diagnóstico de la lengua8. Por lo tanto, se logra el propósito de una alta eficiencia y un procesamiento de alta precisión de los datos de diagnóstico de la lengua. Basado en el conocimiento del diagnóstico de la lengua y la tecnología de aprendizaje profundo, este estudio separó automáticamente el cuerpo de la lengua y el recubrimiento de la lengua de las imágenes de la lengua utilizando un algoritmo informático, con el fin de extraer las características cuantitativas de las lenguas para los médicos, mejorar la confiabilidad y consistencia del diagnóstico y proporcionar métodos para la posterior investigación de objetivación del diagnóstico de la lengua9.
Este estudio ha sido aprobado por el proyecto de la Fundación Nacional de Ciencias Naturales de China, Constructing Dynamic Change rules of TCM Facial image Based on Association Analysis. El número de aprobación ética es 2021KL-027, y el comité de ética ha aprobado que el estudio clínico se lleve a cabo de acuerdo con los documentos aprobados que incluyen el protocolo de investigación clínica (2021.04.12, V2.0), consentimiento informado (2021.04.12, V2.0), materiales de reclutamiento de sujetos (2021.04.12, V2.0), casos de estudio y / o informes de casos, tarjetas del diario de sujetos y otros cuestionarios (2021.04.12, V2.0), una lista de participantes en el ensayo clínico, aprobación de proyectos de investigación, etc. Se obtuvo el consentimiento informado de los pacientes participantes en el estudio. El principal enfoque experimental de este estudio es utilizar imágenes de lengua real para validar y comparar los efectos de segmentación del modelo. La Figura 1 presenta los componentes de la objetivación del diagnóstico de la lengua.
1. Adquisición de imágenes
2. Segmentación de la lengua
3. Clasificación de la lengua
Para obtener los resultados de la comparación, consulte la Figura 12, la Figura 13 y la Tabla 1, donde el entorno construido por este estudio utiliza las mismas muestras para entrenar y probar el modelo de algoritmo. Indicador MIoU: U-Net > Seg-Net > PSPNet > DeeplabV3; Indicador MPA: U-Net > Seg-Net > PSPNet > DeeplabV3; indicador de precisión: U-Net > Seg-Net > DeeplabV3 > PSPNet; Recordemos: U-Net > Seg-Net > PSPNet > DeeplabV3. Cuanto may...
Sobre la base de los resultados de comparación presentados anteriormente, es evidente que las características de los cuatro algoritmos considerados son variadas, y sus distintas ventajas y desventajas se describen a continuación. La estructura U-Net, basada en la modificación y expansión de una red de convolución completa, puede obtener información contextual y posicionamiento preciso a través de una ruta de contratación y una ruta de expansión simétrica. Al clasificar cada punto de píxel, este algoritmo logr...
Los autores no tienen ningún conflicto de intereses que declarar.
Este trabajo fue apoyado por la Fundación Nacional de la Naturaleza de China (subvención no.82004504), el Programa Nacional de Investigación y Desarrollo Clave del Ministerio de Ciencia y Tecnología de China (subvención no.2018YFC1707606), la Administración de Medicina China de la Provincia de Sichuan (subvención no.2021MS199) y la Fundación Nacional de la Naturaleza de China (subvención no.82174236).
Name | Company | Catalog Number | Comments |
CPU | Intel(R) Core(TM) i7-9700K | ||
GPU | NVIDIA GeForce RTX 3070 Ti (8192MB) | ||
Operating systems | Microsoft Windows 10 Professional Edition (64-bit) | ||
Programming language | Python | ||
RAM | 16G |
Solicitar permiso para reutilizar el texto o las figuras de este JoVE artículos
Solicitar permisoThis article has been published
Video Coming Soon
ACERCA DE JoVE
Copyright © 2025 MyJoVE Corporation. Todos los derechos reservados