JoVE Logo

S'identifier

Un abonnement à JoVE est nécessaire pour voir ce contenu. Connectez-vous ou commencez votre essai gratuit.

Dans cet article

  • Résumé
  • Résumé
  • Introduction
  • Protocole
  • Résultats
  • Discussion
  • Déclarations de divulgation
  • Remerciements
  • matériels
  • Références
  • Réimpressions et Autorisations

Résumé

La présente étude a utilisé U-Net et d’autres algorithmes d’apprentissage profond pour segmenter une image de langue et a comparé les résultats de la segmentation pour étudier l’objectivation du diagnostic de la langue.

Résumé

Le diagnostic de la langue est une technique essentielle du diagnostic de la médecine traditionnelle chinoise (MTC), et le besoin d’objectiver les images de la langue grâce à la technologie de traitement d’image augmente. La présente étude donne un aperçu des progrès réalisés dans l’objectivation de la langue au cours de la dernière décennie et compare les modèles de segmentation. Différents modèles d’apprentissage profond sont construits pour vérifier et comparer les algorithmes à l’aide d’ensembles d’images de langue réelles. Les forces et les faiblesses de chaque modèle sont analysées. Les résultats indiquent que l’algorithme U-Net surpasse les autres modèles en ce qui concerne la précision de précision (PA), le rappel et l’intersection moyenne sur les mesures d’union (MIoU). Cependant, malgré les progrès significatifs dans l’acquisition et le traitement de l’image de la langue, une norme uniforme pour objectiver le diagnostic de la langue n’a pas encore été établie. Pour faciliter l’application généralisée des images de langue capturées à l’aide d’appareils mobiles dans l’objectivation du diagnostic de la langue, d’autres recherches pourraient résoudre les défis posés par les images de langue capturées dans des environnements complexes.

Introduction

L’observation de la langue est une technique largement utilisée dans la médecine ethnique traditionnelle chinoise (MTC). La couleur et la forme de la langue peuvent refléter la condition physique et diverses propriétés, sévérités et pronostics de la maladie. Par exemple, dans la médecine traditionnelle Hmong, la couleur de la langue est utilisée pour identifier la température corporelle, par exemple, une langue rouge ou violette indique des facteurs pathologiques liés à la chaleur. Dans la médecine tibétaine, une condition est jugée en observant la langue d’un patient, en prêtant attention à la couleur, la forme et l’humidité du mucus. Par exemple, les langues des patients atteints de la maladie de Heyi deviennent rouges et rugueuses ou noires et sèches1; les patients atteints de la maladie de Xieri2 ont la langue jaune et sèche; pendant ce temps, les patients atteints de la maladie de Badakan3 ont une langue blanche, humide et douce4. Ces observations révèlent la relation étroite entre les caractéristiques de la langue et la physiologie et la pathologie. Dans l’ensemble, l’état de la langue joue un rôle essentiel dans le diagnostic, l’identification de la maladie et l’évaluation de l’effet du traitement.

Simultanément, en raison de la diversité des conditions de vie et des pratiques alimentaires entre les différents groupes ethniques, les variations dans les images de la langue sont évidentes. Le modèle Lab, établi sur la base d’une norme internationale pour la détermination de la couleur, a été formulé par la Commission Internationale d’Éclairage (CIE) en 1931. En 1976, un motif de couleur a été modifié et nommé. Le modèle colorimétrique Lab est composé de trois éléments : L correspond à la luminosité, tandis que a et b sont deux canaux de couleur. a Comprend des couleurs allant du vert foncé (valeur de luminosité faible) au gris (valeur de luminosité moyenne) en passant par le rose vif (valeur de luminosité élevée); b va du bleu vif (valeur de luminosité faible) au gris (valeur de luminosité moyenne) puis au jaune (valeur de luminosité élevée). En comparant les valeurs L x a x b de la couleur de la langue de cinq groupes ethniques, Yang et al.5 ont constaté que les caractéristiques des images de langue des groupes Hmong, Hui, Zhuang, Han et mongol étaient significativement distinctes les unes des autres. Par exemple, les Mongols ont une langue foncée avec un revêtement de langue jaune, tandis que les Hmong ont des langues claires avec un revêtement de langue blanche, ce qui suggère que les caractéristiques de la langue peuvent être utilisées comme indicateur diagnostique pour évaluer l’état de santé d’une population. De plus, les images de langue peuvent fonctionner comme un indice d’évaluation pour la médecine fondée sur des preuves dans la recherche clinique de la médecine ethnique. Lui et coll.6 ont utilisé des images de langue comme base pour le diagnostic de la MTC et ont systématiquement évalué l’innocuité et l’efficacité des pastilles de Chou-Ling-Dan (granules de DCC utilisés pour traiter les maladies inflammatoires et fébriles, y compris la grippe saisonnière dans la MTC) combinés à la médecine chinoise et occidentale. Les résultats ont établi la validité scientifique des images de langue comme indice d’évaluation pour les études cliniques. Néanmoins, les tradipraticiens s’appuient généralement sur la subjectivité pour observer les caractéristiques de la langue et évaluer les conditions physiologiques et pathologiques des patients, nécessitant des indicateurs plus précis.

L’émergence d’Internet et de la technologie de l’intelligence artificielle a ouvert la voie à la numérisation et à l’objectivation du diagnostic de la langue. Ce processus implique l’utilisation de modèles mathématiques pour fournir une description qualitative et objective des images de la langue7, reflétant le contenu de l’image de la langue. Le processus comprend plusieurs étapes : acquisition d’image, compensation optique, correction des couleurs et transformation géométrique. Les images prétraitées sont ensuite introduites dans un modèle algorithmique pour le positionnement et la segmentation des images, l’extraction de caractéristiques, la reconnaissance de formes, etc. Le résultat de ce processus est un diagnostic très efficace et précis des données d’image de la langue, atteignant ainsi l’objectif d’objectivation, de quantification et d’informatisation du diagnostic de la langue8. Ainsi, l’objectif d’un traitement de haute efficacité et de haute précision des données de diagnostic de la langue est atteint. Basée sur les connaissances en matière de diagnostic de la langue et la technologie d’apprentissage profond, cette étude a automatiquement séparé le corps de la langue et le revêtement de la langue des images de la langue à l’aide d’un algorithme informatique, afin d’extraire les caractéristiques quantitatives des langues pour les médecins, d’améliorer la fiabilité et la cohérence du diagnostic et de fournir des méthodes pour la recherche ultérieure sur l’objectivation du diagnostic de la langue9.

Access restricted. Please log in or start a trial to view this content.

Protocole

Cette étude a été approuvée par le projet de la Fondation nationale des sciences naturelles de Chine, Constructing Dynamic Change rules of TCM Facial image Based on Association Analysis. Le numéro d’approbation éthique est 2021KL-027, et le comité d’éthique a approuvé l’étude clinique à réaliser conformément aux documents approuvés qui comprennent le protocole de recherche clinique (2021.04.12, V2.0), le consentement éclairé (2021.04.12, V2.0), le matériel de recrutement des sujets (2021.04.12, V2.0), les cas d’étude et / ou les rapports de cas, les cartes de journal sujet et autres questionnaires (2021.04.12, V2.0), une liste des participants à l’essai clinique, approbation de projets de recherche, etc. Le consentement éclairé des patients participant à l’étude a été obtenu. La principale approche expérimentale de cette étude consiste à utiliser des images réelles de la langue pour valider et comparer les effets de segmentation du modèle. La figure 1 présente les composantes de l’objectivation du diagnostic de la langue.

1. Acquisition d’images

  1. Utilisez l’instrument de diagnostic lingual du visage portatif développé par vous-même pour collecter des images linguales du visage des patients.
  2. Remplissez le nom, le sexe, l’âge et la maladie du patient sur la page de l’ordinateur. Les images incluses ici proviennent de patients qui sont venus à la clinique et ont accepté d’être photographiés après avoir été informés du but et du contenu de l’étude. Confirmez que le patient est assis droit, placez tout le visage dans l’instrument d’acquisition d’images et demandez au patient d’étendre sa langue hors de sa bouche au maximum.
  3. Tenez le dispositif d’acquisition d’images connecté à un ordinateur et vérifiez à l’aide des images sur l’écran de l’ordinateur que le patient est dans la bonne position et que la langue et le visage sont complètement exposés.
  4. Appuyez trois fois sur le bouton Prise de vue sur l’écran de l’ordinateur pour prendre trois photos.
    REMARQUE : L’instrument d’acquisition d’images n’en est actuellement qu’au stade de la demande de brevet et n’est pas destiné à un usage commercial, il n’est donc pas destiné à la vente.
  5. Sélectionnez et filtrez manuellement les images de langue et de visage collectées. Filtrez et excluez les images dont l’exposition de la langue et du visage est incomplète, ainsi que les images trop sombres en raison d’une lumière insuffisante. La figure 2 montre la page d’acquisition d’images du logiciel.
  6. Dans la conception expérimentale, collectez trois images de chaque patient à la fois comme alternatives et sélectionnez une image relativement standard, entièrement exposée, bien éclairée et claire comme échantillon pour la formation et les tests ultérieurs de l’algorithme.
  7. Collectez les données après la prise de vue, exportez les données pour un filtrage manuel et supprimez les images non standard visibles à l’œil nu. Utilisez les critères de filtrage et d’exclusion suivants : exposition incomplète de la langue et du visage, et images trop sombres en raison d’une lumière insuffisante. Un exemple d’image sous-éclairée, incomplète et standard est présenté à la figure 3.
    REMARQUE: Une lumière insuffisante est généralement causée par l’incapacité du patient à placer le visage entièrement dans l’instrument. L’exposition complète n’est généralement obtenue qu’en photographiant correctement le patient.

2. Segmentation de la langue

  1. Effectuez une segmentation de l’image de langue à l’aide d’un outil d’annotation en ligne, comme décrit ci-dessous.
    1. Installez Labelme, cliquez sur le bouton Ouvrir dans le coin supérieur gauche de l’interface de l’étiquette, sélectionnez le dossier où se trouve l’image et ouvrez les photos.
    2. Cliquez sur créer un polygone pour démarrer les points de suivi, suivre les formes de la langue et de la langue, les nommer en fonction des zones sélectionnées (par exemple, la langue et la surface linguale) et les enregistrer.
    3. Lorsque toutes les marques sont terminées, cliquez sur Enregistrer pour enregistrer l’image dans le dossier de données. Voir la figure 4 pour un organigramme détaillé.
      REMARQUE: Comme les images peuvent avoir des différences de pixels, les images ne peuvent pas être directement utilisées pour la formation et les tests d’algorithme.
  2. Unifiez les images à la même taille en remplissant les images, avec le côté long de l’image comme longueur de remplissage cible et en effectuant un remplissage de bord blanc pour remplir les images en carré, avec le côté long de l’image comme longueur de bord. La taille de l’image capturée par l’appareil est de 1080 x 1920 pixels et la taille de l’image remplie est de 1920 x 1920 pixels. Voir la figure 5.
  3. Appliquez l’amélioration de l’image si nécessaire. Aucune amélioration n’a été appliquée dans cette étude, car les images utilisées ont été prises dans une scène fixe et ont été moins affectées par l’environnement, l’éclairage et d’autres facteurs.
  4. Étant donné que trois images ont été collectées pour chaque patient pendant le processus de prise de vue pour tenir compte de facteurs incontrôlables, tels que le clignotement du sujet et le blocage de l’objectif, filtrez manuellement les images de chaque patient pour conserver une image par patient.
  5. Dans le but d’entraîner le modèle, collectez les données de 200 personnes ou 600 images. Après la projection, conservez environ 200 images utilisables.
  6. Selon le numéro d’image, divisez au hasard toutes les images de langue, en plaçant 70% d’entre elles dans l’ensemble d’entraînement et 30% dans l’ensemble de test dans une feuille de calcul.

3. Classification de la langue

  1. Allez sur les sites officiels et téléchargez et installez Anaconda, Python et Labelme. Activez l’environnement et terminez l’installation et le réglage de l’environnement global. Reportez-vous à la figure 6 pour obtenir un organigramme décrivant l’installation et la configuration du logiciel.
  2. Créez le modèle d’algorithme de deep learning dans l’environnement installé, ajustez les paramètres et terminez la formation du modèle à l’aide de l’ensemble d’apprentissage. Effectuez la sélection et le réglage du modèle comme décrit dans les étapes suivantes.
    1. Sélection du modèle : Choisissez le modèle approprié en fonction de l’objectif de la recherche. Après avoir examiné les recherches sur le traitement de l’image de la langue au cours des 5 dernières années, quatre algorithmes, U-Net, Seg-Net, DeeplabV3 et PSPNet, ont été sélectionnés pour validation dans cette étude (voir Fichier de codage supplémentaire 1, Fichier de codage supplémentaire 2, Fichier de codage supplémentaire 3 et Fichier de codage supplémentaire 4 pour les codes de modèle).
    2. Construction de l’ensemble de données : Après avoir terminé la sélection du modèle, construire l’ensemble de données requis en conjonction avec le contenu de la recherche, principalement en utilisant l’annotation Labelme et les méthodes de taille d’image uniforme, comme décrit ci-dessus.
  3. Effectuer la formation sur le modèle comme décrit ci-dessous. La figure 7 montre les détails de l’opération d’entraînement de l’algorithme.
    1. Entrez les données dans le réseau neuronal pour la propagation directe, chaque neurone entrant d’abord une accumulation pondérée de valeurs, puis entrant une fonction d’activation comme valeur de sortie de ce neurone pour obtenir le résultat.
    2. Entrez le résultat dans la fonction d’erreur et comparez-le avec la valeur attendue pour obtenir l’erreur et juger du degré de reconnaissance par erreur. Plus la fonction de perte est petite, meilleur sera le modèle.
    3. Réduisez l’erreur par rétropropagation et déterminez le vecteur gradient. Ajustez les pondérations par le vecteur dégradé à la tendance vers les résultats afin que l’erreur tende à être nulle ou diminue.
    4. Répétez ce processus d’apprentissage jusqu’à ce que l’ensemble soit terminé ou que la valeur d’erreur ne diminue plus, après quoi la formation du modèle est terminée. Voir la figure 8 pour un organigramme du modèle d’algorithme en formation et en test.
  4. Testez les quatre modèles en utilisant les mêmes données de test pour la segmentation et jugez les performances du modèle en fonction de l’effet de segmentation. Les quatre mesures de précision, de rappel, de précision moyenne des pixels (MPA) et de MIoU fournissent une évaluation plus complète des performances du modèle.
  5. Une fois les résultats des quatre modèles générés, comparez leurs valeurs horizontalement; Plus la valeur est élevée, plus la précision de segmentation est élevée et meilleures sont les performances du modèle. Voir la figure 9, la figure 10 et la figure 11.

Access restricted. Please log in or start a trial to view this content.

Résultats

Pour les résultats de la comparaison, voir la figure 12, la figure 13 et le tableau 1, où l’environnement construit par cette étude utilise les mêmes échantillons pour former et tester le modèle algorithmique. Indicateur MIoU: U-Net > Seg-Net > PSPNet > DeeplabV3; Indicateur AMP : U-Net > Seg-Net > PSPNet > DeeplabV3 ; indicateur de précision: U-Net > Seg-Net > DeeplabV3 > PSPNet; rappel : U-Net > Seg-Net > PSPNet > DeeplabV3. Plus la v...

Access restricted. Please log in or start a trial to view this content.

Discussion

Sur la base des résultats de comparaison présentés ci-dessus, il est évident que les caractéristiques des quatre algorithmes considérés sont variées et que leurs avantages et inconvénients distincts sont décrits ci-dessous. La structure U-Net, basée sur la modification et l’expansion d’un réseau de convolution complet, peut obtenir des informations contextuelles et un positionnement précis grâce à un chemin de contraction et un chemin d’expansion symétrique. En classant chaque point de pixel, cet al...

Access restricted. Please log in or start a trial to view this content.

Déclarations de divulgation

Les auteurs n’ont aucun conflit d’intérêts à déclarer.

Remerciements

Ce travail a été soutenu par la Fondation nationale de la nature de Chine (subvention n ° 82004504), le Programme national de recherche et de développement clé du ministère de la Science et de la Technologie de Chine (subvention n ° 2018YFC1707606), l’Administration de la médecine chinoise de la province du Sichuan (subvention n ° 2021MS199) et la Fondation nationale de la nature de Chine (subvention n ° 82174236).

Access restricted. Please log in or start a trial to view this content.

matériels

NameCompanyCatalog NumberComments
CPUIntel(R) Core(TM) i7-9700K
GPU NVIDIA GeForce RTX 3070 Ti (8192MB)
Operating systemsMicrosoft Windows 10 Professional Edition (64-bit)
Programming languagePython
RAM16G

Références

  1. Jiu, G., et al. Effects of herbal therapy on intestinal microbiota and serum metabolomics in different rat models of Mongolian medicine. Evidence-Based Complementary and Alternative. 2022, 7255780(2022).
  2. Xi, J., Xin, Y., Teregle, Study on the correlation between the animal model of Mongolian medicine 34;Xieri disease" and serum ALT and AST. Electronic Journal of Cardiovascular Diseases in Combination of Traditional Chinese. 4 (33), 134-135 (2016).
  3. Yin, L., et al. Study on the mechanism of serum differential protein changes in bronchial asthma based on proteomics. Chinese Journal of Traditional Chinese Medicine. 47 (22), 6227-6234 (2022).
  4. Wang, X. H., Bao, L. Band Seed. The origin and development of tongue diagnosis in Mongolian medicine. Chinese Ethnic Folk Medicine. (1), 64-65 (2008).
  5. Yang, S., et al. A comparative study on the feature parameters of tongue diagnosis images in five nationalities. Chinese Journal of Traditional Chinese Medicine. 36 (11), 6428-6430 (2021).
  6. He, J. Y., et al. Efficacy and safety of Chou-Ling-Dan granules in the treatment of seasonal influenza via combining Western and traditional Chinese medicine, protocol for a multicentre, randomised controlled clinical trial. BMJ Open. 9 (4), e024800(2019).
  7. Wang, D. J., et al. Scientific knowledge mapping and visualization analysis in the field of Chinese medicine tongue feature objectification research. World Science and Technology - Modernization of Chinese Medicine. 23 (9), 3032-3040 (2021).
  8. Yuan, S. M., Qian, P., Li, F. F. Research progress of color correction methods for tongue and face diagnosis in traditional Chinese Medicine. Chinese Journal of Traditional Chinese Medicine. 34 (9), 4183-4185 (2019).
  9. Kanawong, R., et al. Tongue image analysis and its mobile app development for health diagnosis. Advances in Experimental Medicine and Biology. 1005, 99-121 (2017).
  10. Yu, Y., et al. Semantic segmentation evaluation index and evaluation method. Computer Engineering and Application. , (2023).
  11. Sehyung, L., Negishi, M., Urakubo, H., Kasai, H., Ishii, S. Mu-net: Multi-scale U-net for two-photon microscopy image denoising and restoration. Neural Networks. 125, 92-103 (2020).
  12. Huang, X. M., et al. A review on the application of U-Net and its variants in medical image segmentation. Chinese Journal of Biomedical Engineering. 41 (5), 567-576 (2022).
  13. Lu, J. H., Xu, Y. F., Wang, Y. Q., Hao, Y. M. Research overview of tongue objectification in traditional Chinese medicine based on computer image technology. World Science and Technology - Modernization of Traditional Chinese Medicine. 24 (11), 4568-4573 (2022).
  14. Mansour, R. F., Althobaiti, M. M., Ashour, A. A. Internet of things and synergic deep learning based biomedical tongue color image analysis for disease diagnosis and classification. IEEE Access. 9, 94769-94779 (2021).
  15. Cai, Y. H., Hu, S. B., Guan, J., Zhang, X. F. Analysis of the development and application of tongue diagnosis objectification techniques in Chinese medicine. World Science and Technology - Modernization of Chinese Medicine. 23 (7), 2447-2453 (2021).
  16. Ghosh, S., Das, N., Nasipuri, M. Reshaping inputs for convolutional neural network: some common and uncommon methods. Pattern Recognition. 93, 79-94 (2019).
  17. Shang, Z. M., et al. Research progress of digital acquisition and characterization of tongue diagnosis information. Chinese Journal of Traditional Chinese Medicine. 36 (10), 6010-6013 (2021).
  18. Ning, J., Zhang, D., Wu, C., Yue, F. Automatic tongue image segmentation based on gradient vector flow and region merging. Neural Computing and Applications. 21, 1819-1826 (2012).
  19. Zheng, F., Huang, X. Y., Wang, B. L., Wang, Y. H. A method for tongue detection based on image segmentation. Journal of Xiamen University. 55 (6), 895-900 (2016).
  20. Li, Y. T., Luo, Y. S., Zhu, Z. M. Deep learning-based tongue feature analysis. Computer Science. 47 (11), 148-158 (2020).
  21. Wang, Y. D., Sun, C. H., Cui, J. L., Wu, X. R., Qin, Y. X. Research on deep learning-based tongue fissure segmentation algorithm. World Science and Technology - Modernization of Chinese Medicine. 23 (9), 3065-3073 (2021).
  22. Wang, X. M., Wang, R. Y., Guo, D., Lu, S. Z., Zhou, P. Research on the identification method of tongue punctures based on auxiliary light source. Journal of Sensing Technology. 29 (10), 1553-1559 (2016).
  23. Yang, J. D., Zhang, P. A fully connected neural network based on migration learning for tongue image classification. Journal of the Second Military Medical University. 39 (8), 897-902 (2018).
  24. Song, C., Wang, B., Xu, J. T. Research on tongue feature classification method based on deep migration learning. Computer Engineering and Science. 43 (8), 1488-1496 (2021).
  25. Ding, H. J., He, J. C. Study on modern techniques and methods of tongue diagnosis. Shi Zhen Chinese Medicine. 21 (5), 1230-1232 (2010).
  26. Zhai, P. B., et al. A multi-stage tongue image classification algorithm incorporating attention mechanism. Computer Engineering and Design. 42 (6), 1606-1613 (2021).
  27. Hou, Y. S. A new clustering analysis algorithm based on deep learning. Journal of Xinxiang University. 35 (12), 4(2018).
  28. Shi, Y. L., et al. A decision tree algorithm for classification of non-small cell lung cancer evidence based on tongue and pulse data. World Science and Technology - Modernization of Chinese Medicine. 24 (7), 2766-2775 (2022).
  29. Li, J., Hu, X. J., Zhou, C. L., Xu, J. T. Study on the feature analysis and diagnosis model of diabetic tongue based on random forest algorithm. Chinese Journal of Traditional Chinese Medicine. 37 (3), 1639-1643 (2022).
  30. Chen, C. H., et al. The characteristics of the combination of the four diagnostic methods of traditional Chinese medicine from the perspective of the differences between Chinese and Western medical diagnosis methods. Journal of Guangzhou University of Traditional Chinese Medicine. 28 (3), 332-334 (2011).
  31. Chen, R., et al. Correlation analysis of tongue image and western medicine typing in 382 patients with novel coronavirus pneumonia based on Lab colour model and imaging histology. Chinese Journal of Traditional Chinese Medicine. 36 (12), 7010-7014 (2021).
  32. Ju, J. W., Jung, H., Lee, Y. J., Mun, S. W., Lee, J. H. Semantic segmentation dataset for AI-based quantification of clean mucosa in capsule endoscopy. Medicina. 58 (3), 397(2022).
  33. Wu, X., et al. A review of research on deep learning in tongue image classification. Computer Science and Exploration. , 1-23 (2022).

Access restricted. Please log in or start a trial to view this content.

Réimpressions et Autorisations

Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE

Demande d’autorisation

Explorer plus d’articles

M decinenum ro 194m decine ethniquem decine traditionnelle chinoisediagnostic de la languealgorithmeapprentissage profond

This article has been published

Video Coming Soon

JoVE Logo

Confidentialité

Conditions d'utilisation

Politiques

Recherche

Enseignement

À PROPOS DE JoVE

Copyright © 2025 MyJoVE Corporation. Tous droits réservés.