É necessária uma assinatura da JoVE para visualizar este conteúdo. Faça login ou comece sua avaliação gratuita.
Method Article
* Estes autores contribuíram igualmente
O presente estudo empregou U-Net e outros algoritmos de aprendizagem profunda para segmentar uma imagem de língua e comparou os resultados da segmentação para investigar a objetivação do diagnóstico de língua.
O diagnóstico da língua é uma técnica essencial do diagnóstico da medicina tradicional chinesa (MTC), e a necessidade de objetivar imagens da língua por meio da tecnologia de processamento de imagens é crescente. O presente estudo fornece uma visão geral dos progressos realizados na objetivação da língua na última década e compara modelos de segmentação. Vários modelos de aprendizagem profunda são construídos para verificar e comparar algoritmos usando conjuntos de imagens reais da língua. Os pontos fortes e fracos de cada modelo são analisados. Os resultados indicam que o algoritmo U-Net supera outros modelos em relação à precisão de precisão (PA), recordação e média de interseção sobre união (MIoU). No entanto, apesar do progresso significativo na aquisição e processamento das imagens da língua, um padrão uniforme para objetivar o diagnóstico da língua ainda não foi estabelecido. Para facilitar a aplicação generalizada de imagens de língua capturadas usando dispositivos móveis na objetivação do diagnóstico da língua, novas pesquisas poderiam abordar os desafios colocados pelas imagens de língua capturadas em ambientes complexos.
A observação da língua é uma técnica amplamente utilizada na medicina étnica tradicional chinesa (MTC). A cor e a forma da língua podem refletir a condição física e várias propriedades, severidades e prognósticos da doença. Por exemplo, na medicina tradicional hmong, a cor da língua é usada para identificar a temperatura corporal, por exemplo, uma língua vermelha ou roxa indica fatores patológicos relacionados ao calor. Na medicina tibetana, uma condição é julgada observando a língua de um paciente, prestando atenção à cor, forma e umidade do muco. Por exemplo, as línguas de pacientes com doença de Heyi tornam-se vermelhas e ásperas ou pretas e secas1; pacientes com doença de Xieri2 têm línguas amarelas e secas; enquanto isso, os pacientes com doença de Badakan3 apresentam língua branca, úmida e mole4. Essas observações revelam a estreita relação entre as características da língua e a fisiologia e patologia. Em geral, o estado da língua desempenha um papel vital no diagnóstico, identificação da doença e avaliação do efeito do tratamento.
Simultaneamente, devido às diversas condições de vida e práticas alimentares entre diferentes grupos étnicos, variações nas imagens da língua são evidentes. O modelo Lab, estabelecido com base em um padrão internacional para a determinação da cor, foi formulado pela Commission International Eclairage (CIE) em 1931. Em 1976, um padrão de cores foi modificado e nomeado. O modelo de cores Lab é composto por três elementos: L corresponde ao brilho, enquanto a e b são dois canais de cor. a inclui cores de verde escuro (baixo valor de brilho) a cinza (valor de brilho médio) a rosa brilhante (alto valor de brilho); b vai de azul brilhante (baixo valor de brilho) para cinza (valor de brilho médio) para amarelo (alto valor de brilho). Yang et al.5 , comparando os valores de L x a x b da cor da língua de cinco grupos étnicos, verificaram que as características das imagens de língua dos grupos Hmong, Hui, Zhuang, Han e Mongol eram significativamente distintas entre si. Por exemplo, os mongóis têm línguas escuras com um revestimento de língua amarela, enquanto os hmong têm línguas claras com um revestimento de língua branca, sugerindo que as características da língua podem ser usadas como um indicador diagnóstico para avaliar o estado de saúde de uma população. Além disso, imagens de língua podem funcionar como um índice de avaliação para a medicina baseada em evidências em pesquisas clínicas de medicina étnica. He et al.6 empregaram imagens da língua como base para o diagnóstico da MTC e avaliaram sistematicamente a segurança e eficácia dos pellets de Chou-Ling-Dan (grânulos de CLD usados para tratar doenças inflamatórias e febris, incluindo influenza sazonal na MTC) combinados com a medicina chinesa e ocidental. Os resultados estabeleceram a validade científica das imagens de língua como índice de avaliação para estudos clínicos. No entanto, os médicos tradicionais geralmente se valem da subjetividade para observar as características da língua e avaliar as condições fisiológicas e patológicas dos pacientes, exigindo indicadores mais precisos.
O surgimento da internet e da tecnologia de inteligência artificial abriu caminho para a digitalização e objetivação do diagnóstico da língua. Esse processo envolve o uso de modelos matemáticos para fornecer uma descrição qualitativa e objetiva das imagens de língua7, refletindo o conteúdo da imagem de língua. O processo inclui várias etapas: aquisição de imagens, compensação óptica, correção de cores e transformação geométrica. As imagens pré-processadas são então alimentadas em um modelo algorítmico para posicionamento e segmentação de imagens, extração de características, reconhecimento de padrões, etc. O resultado desse processo é um diagnóstico altamente eficiente e preciso dos dados de imagens da língua, alcançando assim o objetivo de objetivação, quantificação e informatização do diagnóstico dalíngua8. Assim, o objetivo de processamento de alta eficiência e alta precisão dos dados de diagnóstico da língua é alcançado. Com base no conhecimento do diagnóstico da língua e na tecnologia de aprendizagem profunda, este estudo separou automaticamente o corpo da língua e o revestimento da língua das imagens da língua usando um algoritmo de computador, a fim de extrair as características quantitativas das línguas para os médicos, melhorar a confiabilidade e a consistência do diagnóstico e fornecer métodos para pesquisas subsequentes de objetivação do diagnósticoda língua 9.
Este estudo foi aprovado pelo projeto da Fundação Nacional de Ciências Naturais da China, Constructing Dynamic Change rules of TCM Facial image Based on Association Analysis. O número de aprovação ética é 2021KL-027, e o comitê de ética aprovou o estudo clínico a ser realizado de acordo com os documentos aprovados, que incluem protocolo de pesquisa clínica (2021.04.12, V2.0), consentimento informado (2021.04.12, V2.0), materiais de recrutamento de sujeitos (2021.04.12, V2.0), casos de estudo e/ou relatos de caso, fichas de diário do assunto e outros questionários (2021.04.12, V2.0), uma lista de participantes no ensaio clínico, aprovação de projeto de pesquisa, etc. Consentimento informado dos pacientes participantes do estudo foi obtido. A principal abordagem experimental deste estudo é usar imagens reais da língua para validar e comparar os efeitos de segmentação do modelo. A Figura 1 apresenta os componentes da objetivação do diagnóstico da língua.
1. Aquisição de imagens
2. Segmentação da língua
3. Classificação da língua
Para os resultados da comparação, ver Figura 12, Figura 13 e Tabela 1, onde o ambiente construído por este estudo usa as mesmas amostras para treinar e testar o modelo do algoritmo. Indicador MIoU: U-Net > Seg-Net > PSPNet > DeeplabV3; Indicador MPA: U-Net > Seg-Net > PSPNet > DeeplabV3; indicador de precisão: U-Net > Seg-Net > DeeplabV3 > PSPNet; recall: U-Net > Seg-Net > PSPNet > DeeplabV3. Quanto maior o valor do índice, maior a precis?...
Com base nos resultados de comparação apresentados acima, fica evidente que as características dos quatro algoritmos considerados são variadas, e suas vantagens e desvantagens distintas são descritas a seguir. A estrutura U-Net, baseada na modificação e expansão de uma rede de convolução completa, pode obter informações contextuais e posicionamento preciso através de um caminho de contratação e um caminho de expansão simétrico. Ao classificar cada ponto de pixel, esse algoritmo alcança uma maior precis?...
Os autores declaram não haver conflitos de interesse.
Este trabalho foi apoiado pela Fundação Nacional da Natureza da China (concessão n.º 82004504), pelo Programa Nacional de Pesquisa e Desenvolvimento Chave do Ministério da Ciência e Tecnologia da China (concessão n.º 2018YFC1707606), pela Administração de Medicina Chinesa da Província de Sichuan (concessão n.º 2021MS199) e pela Fundação Nacional da Natureza da China (concessão n.º 82174236).
Name | Company | Catalog Number | Comments |
CPU | Intel(R) Core(TM) i7-9700K | ||
GPU | NVIDIA GeForce RTX 3070 Ti (8192MB) | ||
Operating systems | Microsoft Windows 10 Professional Edition (64-bit) | ||
Programming language | Python | ||
RAM | 16G |
Solicitar permissão para reutilizar o texto ou figuras deste artigo JoVE
Solicitar PermissãoThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Todos os direitos reservados