JoVE Logo

Entrar

É necessária uma assinatura da JoVE para visualizar este conteúdo. Faça login ou comece sua avaliação gratuita.

Neste Artigo

  • Resumo
  • Resumo
  • Introdução
  • Protocolo
  • Resultados
  • Discussão
  • Divulgações
  • Agradecimentos
  • Materiais
  • Referências
  • Reimpressões e Permissões

Resumo

O presente estudo empregou U-Net e outros algoritmos de aprendizagem profunda para segmentar uma imagem de língua e comparou os resultados da segmentação para investigar a objetivação do diagnóstico de língua.

Resumo

O diagnóstico da língua é uma técnica essencial do diagnóstico da medicina tradicional chinesa (MTC), e a necessidade de objetivar imagens da língua por meio da tecnologia de processamento de imagens é crescente. O presente estudo fornece uma visão geral dos progressos realizados na objetivação da língua na última década e compara modelos de segmentação. Vários modelos de aprendizagem profunda são construídos para verificar e comparar algoritmos usando conjuntos de imagens reais da língua. Os pontos fortes e fracos de cada modelo são analisados. Os resultados indicam que o algoritmo U-Net supera outros modelos em relação à precisão de precisão (PA), recordação e média de interseção sobre união (MIoU). No entanto, apesar do progresso significativo na aquisição e processamento das imagens da língua, um padrão uniforme para objetivar o diagnóstico da língua ainda não foi estabelecido. Para facilitar a aplicação generalizada de imagens de língua capturadas usando dispositivos móveis na objetivação do diagnóstico da língua, novas pesquisas poderiam abordar os desafios colocados pelas imagens de língua capturadas em ambientes complexos.

Introdução

A observação da língua é uma técnica amplamente utilizada na medicina étnica tradicional chinesa (MTC). A cor e a forma da língua podem refletir a condição física e várias propriedades, severidades e prognósticos da doença. Por exemplo, na medicina tradicional hmong, a cor da língua é usada para identificar a temperatura corporal, por exemplo, uma língua vermelha ou roxa indica fatores patológicos relacionados ao calor. Na medicina tibetana, uma condição é julgada observando a língua de um paciente, prestando atenção à cor, forma e umidade do muco. Por exemplo, as línguas de pacientes com doença de Heyi tornam-se vermelhas e ásperas ou pretas e secas1; pacientes com doença de Xieri2 têm línguas amarelas e secas; enquanto isso, os pacientes com doença de Badakan3 apresentam língua branca, úmida e mole4. Essas observações revelam a estreita relação entre as características da língua e a fisiologia e patologia. Em geral, o estado da língua desempenha um papel vital no diagnóstico, identificação da doença e avaliação do efeito do tratamento.

Simultaneamente, devido às diversas condições de vida e práticas alimentares entre diferentes grupos étnicos, variações nas imagens da língua são evidentes. O modelo Lab, estabelecido com base em um padrão internacional para a determinação da cor, foi formulado pela Commission International Eclairage (CIE) em 1931. Em 1976, um padrão de cores foi modificado e nomeado. O modelo de cores Lab é composto por três elementos: L corresponde ao brilho, enquanto a e b são dois canais de cor. a inclui cores de verde escuro (baixo valor de brilho) a cinza (valor de brilho médio) a rosa brilhante (alto valor de brilho); b vai de azul brilhante (baixo valor de brilho) para cinza (valor de brilho médio) para amarelo (alto valor de brilho). Yang et al.5 , comparando os valores de L x a x b da cor da língua de cinco grupos étnicos, verificaram que as características das imagens de língua dos grupos Hmong, Hui, Zhuang, Han e Mongol eram significativamente distintas entre si. Por exemplo, os mongóis têm línguas escuras com um revestimento de língua amarela, enquanto os hmong têm línguas claras com um revestimento de língua branca, sugerindo que as características da língua podem ser usadas como um indicador diagnóstico para avaliar o estado de saúde de uma população. Além disso, imagens de língua podem funcionar como um índice de avaliação para a medicina baseada em evidências em pesquisas clínicas de medicina étnica. He et al.6 empregaram imagens da língua como base para o diagnóstico da MTC e avaliaram sistematicamente a segurança e eficácia dos pellets de Chou-Ling-Dan (grânulos de CLD usados para tratar doenças inflamatórias e febris, incluindo influenza sazonal na MTC) combinados com a medicina chinesa e ocidental. Os resultados estabeleceram a validade científica das imagens de língua como índice de avaliação para estudos clínicos. No entanto, os médicos tradicionais geralmente se valem da subjetividade para observar as características da língua e avaliar as condições fisiológicas e patológicas dos pacientes, exigindo indicadores mais precisos.

O surgimento da internet e da tecnologia de inteligência artificial abriu caminho para a digitalização e objetivação do diagnóstico da língua. Esse processo envolve o uso de modelos matemáticos para fornecer uma descrição qualitativa e objetiva das imagens de língua7, refletindo o conteúdo da imagem de língua. O processo inclui várias etapas: aquisição de imagens, compensação óptica, correção de cores e transformação geométrica. As imagens pré-processadas são então alimentadas em um modelo algorítmico para posicionamento e segmentação de imagens, extração de características, reconhecimento de padrões, etc. O resultado desse processo é um diagnóstico altamente eficiente e preciso dos dados de imagens da língua, alcançando assim o objetivo de objetivação, quantificação e informatização do diagnóstico dalíngua8. Assim, o objetivo de processamento de alta eficiência e alta precisão dos dados de diagnóstico da língua é alcançado. Com base no conhecimento do diagnóstico da língua e na tecnologia de aprendizagem profunda, este estudo separou automaticamente o corpo da língua e o revestimento da língua das imagens da língua usando um algoritmo de computador, a fim de extrair as características quantitativas das línguas para os médicos, melhorar a confiabilidade e a consistência do diagnóstico e fornecer métodos para pesquisas subsequentes de objetivação do diagnósticoda língua 9.

Protocolo

Este estudo foi aprovado pelo projeto da Fundação Nacional de Ciências Naturais da China, Constructing Dynamic Change rules of TCM Facial image Based on Association Analysis. O número de aprovação ética é 2021KL-027, e o comitê de ética aprovou o estudo clínico a ser realizado de acordo com os documentos aprovados, que incluem protocolo de pesquisa clínica (2021.04.12, V2.0), consentimento informado (2021.04.12, V2.0), materiais de recrutamento de sujeitos (2021.04.12, V2.0), casos de estudo e/ou relatos de caso, fichas de diário do assunto e outros questionários (2021.04.12, V2.0), uma lista de participantes no ensaio clínico, aprovação de projeto de pesquisa, etc. Consentimento informado dos pacientes participantes do estudo foi obtido. A principal abordagem experimental deste estudo é usar imagens reais da língua para validar e comparar os efeitos de segmentação do modelo. A Figura 1 apresenta os componentes da objetivação do diagnóstico da língua.

1. Aquisição de imagens

  1. Utilizar o instrumento de diagnóstico facial lingual manual auto-desenvolvido para coletar imagens da face lingual dos pacientes.
  2. Preencha o nome do paciente, sexo, idade e doença na página do computador. As imagens aqui incluídas são de pacientes que compareceram ao ambulatório e concordaram em ser fotografados após serem informados sobre o objetivo e o conteúdo do estudo. Confirmar se o paciente está sentado, colocar toda a face no instrumento de aquisição de imagens e instruir o paciente a estender a língua para fora da boca ao máximo.
  3. Segurar o aparelho de aquisição de imagens conectado a um computador e verificar, através das imagens na tela do computador, se o paciente está na posição correta e se a língua e a face estão totalmente expostas.
  4. Pressione o botão Disparar na tela do computador três vezes para tirar três fotos.
    NOTA: O instrumento de aquisição de imagens encontra-se atualmente apenas na fase de pedido de patente e não é para uso comercial, portanto não está à venda.
  5. Selecione e filtre manualmente as imagens de língua e rosto coletadas. Filtre e exclua imagens com língua e rosto incompletos, bem como imagens muito escuras devido à luz insuficiente. A Figura 2 mostra a página de aquisição de imagens do software.
  6. No desenho experimental, colete três imagens de cada paciente por vez como alternativas e selecione uma imagem relativamente padrão, totalmente exposta, bem iluminada e clara como amostra para treinamento e teste subsequente do algoritmo.
  7. Colete dados após a filmagem, exporte os dados para triagem manual e exclua as imagens não padrão visíveis a olho nu. Use os seguintes critérios de filtragem e exclusão: língua incompleta e exposição facial e imagens muito escuras como resultado de luz insuficiente. Um exemplo de uma imagem com pouca iluminação, uma imagem incompleta e uma imagem padrão é mostrado na Figura 3.
    NOTA: A luz insuficiente geralmente é causada pela falha do paciente em colocar a face inteiramente no instrumento. A exposição completa geralmente só é obtida fotografando corretamente o paciente.

2. Segmentação da língua

  1. Realize a segmentação da imagem da língua usando uma ferramenta de anotação on-line, conforme descrito abaixo.
    1. Instale o Labelme, clique no botão Abrir no canto superior esquerdo da interface do rótulo, selecione a pasta onde a imagem está localizada e abra as fotos.
    2. Clique em criar polígono para iniciar pontos de rastreamento, rastrear a língua e as formas linguais, nomeá-las de acordo com as áreas selecionadas (por exemplo, língua e superfície lingual) e salvá-las.
    3. Quando todas as marcas estiverem concluídas, clique em Salvar para salvar a imagem na pasta de dados. Consulte a Figura 4 para obter um fluxograma detalhado.
      Observação : como as imagens podem ter diferenças de pixel, as imagens não podem ser usadas diretamente para treinamento e teste de algoritmo.
  2. Unifique as imagens para o mesmo tamanho preenchendo as imagens com borda, com o lado longo da imagem como o comprimento de preenchimento de destino e realizando o preenchimento de borda branca para preencher as imagens em um quadrado, com o lado longo da imagem como o comprimento da borda. O tamanho da imagem capturada pelo dispositivo é de 1080 x 1920 pixels, e o tamanho da imagem preenchida é de 1920 x 1920 pixels. Veja a Figura 5.
  3. Aplique o aprimoramento da imagem, se necessário. Nenhum aprimoramento foi aplicado neste estudo, pois as imagens utilizadas foram feitas em uma cena fixa e foram menos afetadas pelo ambiente, iluminação e outros fatores.
  4. Como três imagens foram coletadas para cada paciente durante o processo de filmagem para levar em conta fatores incontroláveis, como piscar do objeto e bloqueio do cristalino, as imagens de cada paciente foram selecionadas manualmente para reter uma imagem por paciente.
  5. Para treinar o modelo, colete dados de 200 pessoas, ou 600 imagens. Após a triagem, retenha cerca de 200 imagens utilizáveis.
  6. De acordo com o número da imagem, divida aleatoriamente todas as imagens da língua, colocando 70% delas no conjunto de treinamento e 30% no conjunto de teste em uma planilha.

3. Classificação da língua

  1. Acesse os sites oficiais e baixe e instale o Anaconda, Python e Labelme. Ative o ambiente e conclua a instalação e ajuste do ambiente geral. Consulte a Figura 6 para obter um fluxograma que descreve a instalação e a configuração do software.
  2. Crie o modelo de algoritmo de aprendizado profundo no ambiente instalado, ajuste os parâmetros e conclua o treinamento do modelo usando o conjunto de treinamento. Execute a seleção e o ajuste do modelo conforme descrito nas etapas a seguir.
    1. Seleção do modelo: Escolha o modelo apropriado com base no objetivo da pesquisa. Após a revisão de pesquisas sobre processamento de imagens da língua nos últimos 5 anos, quatro algoritmos, U-Net, Seg-Net, DeeplabV3 e PSPNet, foram selecionados para validação neste estudo (veja Arquivo de Codificação Suplementar 1, Arquivo de Codificação Suplementar 2, Arquivo de Codificação Suplementar 3 e Arquivo de Codificação Suplementar 4 para códigos de modelo).
    2. Construção do conjunto de dados: Após completar a seleção do modelo, construa o conjunto de dados necessário em conjunto com o conteúdo da pesquisa, principalmente usando a anotação Labelme e os métodos de tamanho uniforme da imagem, conforme descrito acima.
  3. Execute o treinamento do modelo conforme descrito abaixo. A Figura 7 mostra detalhes da operação de treinamento do algoritmo.
    1. Insira os dados na rede neural para propagação direta, com cada neurônio primeiro inserindo um acúmulo ponderado de valores e, em seguida, inserindo uma função de ativação como o valor de saída desse neurônio para obter o resultado.
    2. Insira o resultado na função de erro e compare-o com o valor esperado para obter o erro e julgar o grau de reconhecimento por engano. Quanto menor for a função de perda, melhor será o modelo.
    3. Reduza o erro por retropropagação e determine o vetor de gradiente. Ajuste os pesos pelo vetor de gradiente à tendência dos resultados para que o erro tenda a zero ou diminua.
    4. Repita esse processo de treinamento até que o conjunto seja concluído ou o valor do erro não diminua mais, quando o treinamento do modelo for concluído. Consulte a Figura 8 para obter um fluxograma do modelo de algoritmo em treinamento e teste.
  4. Testar os quatro modelos usando os mesmos dados de teste para segmentação e julgar o desempenho do modelo de acordo com o efeito de segmentação. As quatro métricas de precisão, recall, precisão média de pixels (MPA) e MIoU fornecem uma avaliação de desempenho de modelo mais abrangente.
  5. Após os resultados dos quatro modelos serem gerados, comparar seus valores horizontalmente; Quanto maior o valor, maior a precisão da segmentação e melhor o desempenho do modelo. Veja a Figura 9, a Figura 10 e a Figura 11.

Resultados

Para os resultados da comparação, ver Figura 12, Figura 13 e Tabela 1, onde o ambiente construído por este estudo usa as mesmas amostras para treinar e testar o modelo do algoritmo. Indicador MIoU: U-Net > Seg-Net > PSPNet > DeeplabV3; Indicador MPA: U-Net > Seg-Net > PSPNet > DeeplabV3; indicador de precisão: U-Net > Seg-Net > DeeplabV3 > PSPNet; recall: U-Net > Seg-Net > PSPNet > DeeplabV3. Quanto maior o valor do índice, maior a precis?...

Discussão

Com base nos resultados de comparação apresentados acima, fica evidente que as características dos quatro algoritmos considerados são variadas, e suas vantagens e desvantagens distintas são descritas a seguir. A estrutura U-Net, baseada na modificação e expansão de uma rede de convolução completa, pode obter informações contextuais e posicionamento preciso através de um caminho de contratação e um caminho de expansão simétrico. Ao classificar cada ponto de pixel, esse algoritmo alcança uma maior precis?...

Divulgações

Os autores declaram não haver conflitos de interesse.

Agradecimentos

Este trabalho foi apoiado pela Fundação Nacional da Natureza da China (concessão n.º 82004504), pelo Programa Nacional de Pesquisa e Desenvolvimento Chave do Ministério da Ciência e Tecnologia da China (concessão n.º 2018YFC1707606), pela Administração de Medicina Chinesa da Província de Sichuan (concessão n.º 2021MS199) e pela Fundação Nacional da Natureza da China (concessão n.º 82174236).

Materiais

NameCompanyCatalog NumberComments
CPUIntel(R) Core(TM) i7-9700K
GPU NVIDIA GeForce RTX 3070 Ti (8192MB)
Operating systemsMicrosoft Windows 10 Professional Edition (64-bit)
Programming languagePython
RAM16G

Referências

  1. Jiu, G., et al. Effects of herbal therapy on intestinal microbiota and serum metabolomics in different rat models of Mongolian medicine. Evidence-Based Complementary and Alternative. 2022, 7255780 (2022).
  2. Xi, J., Xin, Y., Teregle, Study on the correlation between the animal model of Mongolian medicine 34;Xieri disease" and serum ALT and AST. Electronic Journal of Cardiovascular Diseases in Combination of Traditional Chinese. 4 (33), 134-135 (2016).
  3. Yin, L., et al. Study on the mechanism of serum differential protein changes in bronchial asthma based on proteomics. Chinese Journal of Traditional Chinese Medicine. 47 (22), 6227-6234 (2022).
  4. Wang, X. H., Bao, L. Band Seed. The origin and development of tongue diagnosis in Mongolian medicine. Chinese Ethnic Folk Medicine. (1), 64-65 (2008).
  5. Yang, S., et al. A comparative study on the feature parameters of tongue diagnosis images in five nationalities. Chinese Journal of Traditional Chinese Medicine. 36 (11), 6428-6430 (2021).
  6. He, J. Y., et al. Efficacy and safety of Chou-Ling-Dan granules in the treatment of seasonal influenza via combining Western and traditional Chinese medicine, protocol for a multicentre, randomised controlled clinical trial. BMJ Open. 9 (4), e024800 (2019).
  7. Wang, D. J., et al. Scientific knowledge mapping and visualization analysis in the field of Chinese medicine tongue feature objectification research. World Science and Technology - Modernization of Chinese Medicine. 23 (9), 3032-3040 (2021).
  8. Yuan, S. M., Qian, P., Li, F. F. Research progress of color correction methods for tongue and face diagnosis in traditional Chinese Medicine. Chinese Journal of Traditional Chinese Medicine. 34 (9), 4183-4185 (2019).
  9. Kanawong, R., et al. Tongue image analysis and its mobile app development for health diagnosis. Advances in Experimental Medicine and Biology. 1005, 99-121 (2017).
  10. Yu, Y., et al. Semantic segmentation evaluation index and evaluation method. Computer Engineering and Application. , (2023).
  11. Sehyung, L., Negishi, M., Urakubo, H., Kasai, H., Ishii, S. Mu-net: Multi-scale U-net for two-photon microscopy image denoising and restoration. Neural Networks. 125, 92-103 (2020).
  12. Huang, X. M., et al. A review on the application of U-Net and its variants in medical image segmentation. Chinese Journal of Biomedical Engineering. 41 (5), 567-576 (2022).
  13. Lu, J. H., Xu, Y. F., Wang, Y. Q., Hao, Y. M. Research overview of tongue objectification in traditional Chinese medicine based on computer image technology. World Science and Technology - Modernization of Traditional Chinese Medicine. 24 (11), 4568-4573 (2022).
  14. Mansour, R. F., Althobaiti, M. M., Ashour, A. A. Internet of things and synergic deep learning based biomedical tongue color image analysis for disease diagnosis and classification. IEEE Access. 9, 94769-94779 (2021).
  15. Cai, Y. H., Hu, S. B., Guan, J., Zhang, X. F. Analysis of the development and application of tongue diagnosis objectification techniques in Chinese medicine. World Science and Technology - Modernization of Chinese Medicine. 23 (7), 2447-2453 (2021).
  16. Ghosh, S., Das, N., Nasipuri, M. Reshaping inputs for convolutional neural network: some common and uncommon methods. Pattern Recognition. 93, 79-94 (2019).
  17. Shang, Z. M., et al. Research progress of digital acquisition and characterization of tongue diagnosis information. Chinese Journal of Traditional Chinese Medicine. 36 (10), 6010-6013 (2021).
  18. Ning, J., Zhang, D., Wu, C., Yue, F. Automatic tongue image segmentation based on gradient vector flow and region merging. Neural Computing and Applications. 21, 1819-1826 (2012).
  19. Zheng, F., Huang, X. Y., Wang, B. L., Wang, Y. H. A method for tongue detection based on image segmentation. Journal of Xiamen University. 55 (6), 895-900 (2016).
  20. Li, Y. T., Luo, Y. S., Zhu, Z. M. Deep learning-based tongue feature analysis. Computer Science. 47 (11), 148-158 (2020).
  21. Wang, Y. D., Sun, C. H., Cui, J. L., Wu, X. R., Qin, Y. X. Research on deep learning-based tongue fissure segmentation algorithm. World Science and Technology - Modernization of Chinese Medicine. 23 (9), 3065-3073 (2021).
  22. Wang, X. M., Wang, R. Y., Guo, D., Lu, S. Z., Zhou, P. Research on the identification method of tongue punctures based on auxiliary light source. Journal of Sensing Technology. 29 (10), 1553-1559 (2016).
  23. Yang, J. D., Zhang, P. A fully connected neural network based on migration learning for tongue image classification. Journal of the Second Military Medical University. 39 (8), 897-902 (2018).
  24. Song, C., Wang, B., Xu, J. T. Research on tongue feature classification method based on deep migration learning. Computer Engineering and Science. 43 (8), 1488-1496 (2021).
  25. Ding, H. J., He, J. C. Study on modern techniques and methods of tongue diagnosis. Shi Zhen Chinese Medicine. 21 (5), 1230-1232 (2010).
  26. Zhai, P. B., et al. A multi-stage tongue image classification algorithm incorporating attention mechanism. Computer Engineering and Design. 42 (6), 1606-1613 (2021).
  27. Hou, Y. S. A new clustering analysis algorithm based on deep learning. Journal of Xinxiang University. 35 (12), 4 (2018).
  28. Shi, Y. L., et al. A decision tree algorithm for classification of non-small cell lung cancer evidence based on tongue and pulse data. World Science and Technology - Modernization of Chinese Medicine. 24 (7), 2766-2775 (2022).
  29. Li, J., Hu, X. J., Zhou, C. L., Xu, J. T. Study on the feature analysis and diagnosis model of diabetic tongue based on random forest algorithm. Chinese Journal of Traditional Chinese Medicine. 37 (3), 1639-1643 (2022).
  30. Chen, C. H., et al. The characteristics of the combination of the four diagnostic methods of traditional Chinese medicine from the perspective of the differences between Chinese and Western medical diagnosis methods. Journal of Guangzhou University of Traditional Chinese Medicine. 28 (3), 332-334 (2011).
  31. Chen, R., et al. Correlation analysis of tongue image and western medicine typing in 382 patients with novel coronavirus pneumonia based on Lab colour model and imaging histology. Chinese Journal of Traditional Chinese Medicine. 36 (12), 7010-7014 (2021).
  32. Ju, J. W., Jung, H., Lee, Y. J., Mun, S. W., Lee, J. H. Semantic segmentation dataset for AI-based quantification of clean mucosa in capsule endoscopy. Medicina. 58 (3), 397 (2022).
  33. Wu, X., et al. A review of research on deep learning in tongue image classification. Computer Science and Exploration. , 1-23 (2022).

Reimpressões e Permissões

Solicitar permissão para reutilizar o texto ou figuras deste artigo JoVE

Solicitar Permissão

Explore Mais Artigos

Medicinamedicina tnicamedicina tradicional chinesadiagn stico da l nguaalgoritmoaprendizagem profunda

This article has been published

Video Coming Soon

JoVE Logo

Privacidade

Termos de uso

Políticas

Pesquisa

Educação

SOBRE A JoVE

Copyright © 2025 MyJoVE Corporation. Todos os direitos reservados