JoVE Logo

Войдите в систему

Для просмотра этого контента требуется подписка на Jove Войдите в систему или начните бесплатную пробную версию.

В этой статье

  • Резюме
  • Аннотация
  • Введение
  • протокол
  • Результаты
  • Обсуждение
  • Раскрытие информации
  • Благодарности
  • Материалы
  • Ссылки
  • Перепечатки и разрешения

Резюме

В настоящем исследовании использовались U-Net и другие алгоритмы глубокого обучения для сегментации изображения языка и сравнения результатов сегментации для изучения объективации диагностики языка.

Аннотация

Диагностика языка является важным методом диагностики традиционной китайской медицины (ТКМ), и потребность в объективации изображений языка с помощью технологии обработки изображений растет. В настоящем исследовании представлен обзор прогресса, достигнутого в области объективации языка за последнее десятилетие, и сравниваются модели сегментации. Различные модели глубокого обучения построены для проверки и сравнения алгоритмов с использованием реальных наборов изображений языка. Проанализированы сильные и слабые стороны каждой модели. Полученные данные показывают, что алгоритм U-Net превосходит другие модели в отношении точности точности (PA), отзыва и среднего пересечения по сравнению с метриками объединения (MIoU). Однако, несмотря на значительный прогресс в получении и обработке изображений языка, единый стандарт для объективной диагностики языка еще не установлен. Чтобы облегчить широкое применение изображений языка, снятых с помощью мобильных устройств, для объективации диагностики языка, дальнейшие исследования могли бы решить проблемы, связанные с изображениями языка, снятыми в сложных условиях.

Введение

Наблюдение за языком является широко используемым методом в традиционной китайской этнической медицине (ТКМ). Цвет и форма языка могут отражать физическое состояние и различные свойства, тяжесть и прогнозы заболевания. Например, в традиционной медицине хмонгов цвет языка используется для определения температуры тела, например, красный или фиолетовый язык указывает на патологические факторы, связанные с теплом. В тибетской медицине о состоянии судят, наблюдая за языком пациента, обращая внимание на цвет, форму и влажность слизи. Например, языки пациентов с болезнью Хейи становятся красными и шероховатыми или черными и сухими1; пациенты с болезнью Сиери2 имеют желтые и сухие языки; между тем, пациенты с болезнью Бадакан3 имеют белый, влажный и мягкий язык4. Эти наблюдения показывают тесную связь между особенностями языка и физиологией и патологией. В целом, состояние языка играет жизненно важную роль в диагностике, выявлении заболеваний и оценке эффекта лечения.

В то же время, из-за различных условий жизни и практики питания среди различных этнических групп, различия в изображениях языка очевидны. Лабораторная модель, созданная на основе международного стандарта определения цвета, была сформулирована Международной комиссией по эклерированию (CIE) в 1931 году. В 1976 году цветовой узор был изменен и назван. Цветовая модель Lab состоит из трех элементов: L соответствует яркости, а a и b — двум цветовым каналам. a включает цвета от темно-зеленого (значение низкой яркости) до серого (среднее значение яркости) и ярко-розового (значение высокой яркости); b переходит от ярко-синего (низкое значение яркости) к серому (среднее значение яркости) и желтому (высокое значение яркости). Сравнивая значения L x a x b цвета языка пяти этнических групп, Yang et al.5 обнаружили, что характеристики языковых изображений групп хмонгов, хуэй, чжуанов, хань и монголов значительно отличались друг от друга. Например, у монголов темные языки с желтым языковым покрытием, в то время как у хмонгов светлые языки с белым языковым покрытием, что позволяет предположить, что особенности языка можно использовать в качестве диагностического индикатора для оценки состояния здоровья населения. Кроме того, изображения языка могут функционировать в качестве оценочного показателя доказательной медицины в клинических исследованиях этнической медицины. Он и др.6 использовали изображения языка в качестве основы для диагностики ТКМ и систематически оценивали безопасность и эффективность гранул Чжоу-Лин-Дань (гранулы CLD, используемые для лечения воспалительных и лихорадочных заболеваний, включая сезонный грипп в ТКМ) в сочетании с китайской и западной медициной. Результаты установили научную достоверность изображений языка в качестве оценочного показателя для клинических исследований. Тем не менее, традиционные врачи, как правило, полагаются на субъективность для наблюдения за характеристиками языка и оценки физиологических и патологических состояний пациентов, требующих более точных показателей.

Появление Интернета и технологий искусственного интеллекта проложило путь к оцифровке и объективизации диагностики языка. Этот процесс включает в себя использование математических моделей для обеспечения качественного и объективного описания изображений языка7, отражающего содержание изображения языка. Процесс включает в себя несколько этапов: получение изображения, оптическая компенсация, цветокоррекция и геометрическое преобразование. Предварительно обработанные изображения затем вводятся в алгоритмическую модель для позиционирования и сегментации изображений, извлечения признаков, распознавания образов и т. д. Результатом этого процесса является высокоэффективная и точная диагностика данных изображения языка, что позволяет достичь цели объективации, количественной оценки и информатизации диагностики языка8. Таким образом, достигается цель высокой эффективности и высокой точности обработки данных диагностики языка. Основываясь на знаниях о диагностике языка и технологии глубокого обучения, это исследование автоматически отделило тело языка и покрытие языка от изображений языка с помощью компьютерного алгоритма, чтобы извлечь количественные характеристики языков для врачей, повысить надежность и последовательность диагноза и предоставить методы для последующих исследований объективации диагностикиязыка 9.

протокол

Это исследование было одобрено проектом Национального фонда естественных наук Китая «Построение правил динамического изменения изображения лица ТКМ на основе ассоциативного анализа». Номер одобрения этики - 2021KL-027, и комитет по этике одобрил клиническое исследование, которое будет проводиться в соответствии с утвержденными документами, которые включают протокол клинического исследования (2021.04.12, V2.0), информированное согласие (2021.04.12, V2.0), материалы для набора субъектов (2021.04.12, V2.0), случаи исследования и/или отчеты о случаях, дневниковые карточки субъектов и другие анкеты (2021.04.12, V2.0), список участников клинического исследования, утверждение исследовательского проекта и т.д. Было получено информированное согласие пациентов, участвовавших в исследовании. Основной экспериментальный подход этого исследования заключается в использовании реальных изображений языка для проверки и сравнения эффектов сегментации модели. На рисунке 1 представлены компоненты объективизации диагностики языка.

1. Получение изображения

  1. Используйте самостоятельно разработанный ручной лингвальный диагностический прибор для лица для сбора языковых изображений лиц пациентов.
  2. Введите имя пациента, пол, возраст и заболевание на странице компьютера. Изображения, включенные здесь, принадлежат пациентам, которые пришли в клинику и согласились сфотографироваться после того, как были проинформированы о цели и содержании исследования. Убедитесь, что пациент сидит прямо, поместите все лицо в прибор для получения изображения и попросите пациента максимально вытянуть язык изо рта.
  3. Держите устройство для получения изображений, подключенное к компьютеру, и убедитесь по изображениям на экране компьютера, что пациент находится в правильном положении и что язык и лицо полностью открыты.
  4. Нажмите кнопку «Съемка » на экране компьютера три раза, чтобы сделать три снимка.
    ПРИМЕЧАНИЕ: Инструмент для получения изображений в настоящее время находится только на стадии подачи заявки на патент и не предназначен для коммерческого использования, поэтому он не продается.
  5. Вручную выберите и отфильтруйте собранные изображения языка и лица. Фильтруйте и исключайте изображения с неполной экспозицией языка и лица, а также изображения, которые слишком темные из-за недостаточного освещения. На рисунке 2 показана страница получения изображения программного обеспечения.
  6. В экспериментальном дизайне соберите три изображения от каждого пациента одновременно в качестве альтернативы и выберите относительно стандартное, полностью экспонированное, хорошо освещенное и четкое изображение в качестве образца для последующего обучения и тестирования алгоритма.
  7. Собирайте данные после съемки, экспортируйте данные для ручного скрининга и удаляйте нестандартные изображения, видимые невооруженным глазом. Используйте следующие критерии фильтрации и исключения: неполная экспозиция языка и лица, а также слишком темные изображения из-за недостаточного освещения. Пример недостаточно освещенного, неполного и стандартного изображения показан на рисунке 3.
    ПРИМЕЧАНИЕ: Недостаточное освещение обычно вызвано тем, что пациент не помещает лицо полностью в инструмент. Полная экспозиция обычно получается только при правильном фотографировании пациента.

2. Сегментация языка

  1. Выполните сегментацию изображений языка с помощью онлайн-инструмента аннотации, как описано ниже.
    1. Установите Labelme, нажмите кнопку « Открыть » в верхнем левом углу интерфейса этикетки, выберите папку, в которой находится изображение, и откройте фотографии.
    2. Нажмите « Создать многоугольник », чтобы начать отслеживать точки, отслеживать формы языка и языка, называть их в соответствии с выбранными областями (например, языком и язычной поверхностью) и сохранять их.
    3. Когда все отметки будут завершены, нажмите кнопку Сохранить , чтобы сохранить изображение в папке с данными. Подробную блок-схему см. на рисунке 4 .
      ПРИМЕЧАНИЕ: Поскольку изображения могут иметь различия в пикселях, изображения не могут быть напрямую использованы для обучения и тестирования алгоритмов.
  2. Объедините изображения до одинакового размера, заполнив изображения краями, указав длинную сторону изображения в качестве целевой длины заливки и выполнив белую заливку краев, чтобы заполнить изображения до квадрата, а длинная сторона изображения стала длиной края. Размер изображения, захваченного устройством, составляет 1080 x 1920 пикселей, а размер заполненного изображения — 1920 x 1920 пикселей. Смотрите рисунок 5.
  3. При необходимости примените улучшение изображения. В этом исследовании не было применено никаких улучшений, так как используемые изображения были сделаны в фиксированной сцене и были менее подвержены влиянию окружающей среды, освещения и других факторов.
  4. Поскольку в процессе съемки для каждого пациента было собрано три изображения, чтобы учесть неконтролируемые факторы, такие как моргание объекта и блокировка объектива, вручную просматривайте изображения каждого пациента, чтобы сохранить одно изображение для каждого пациента.
  5. С целью обучения модели соберите данные от 200 человек, или 600 изображений. После скрининга сохраните около 200 пригодных для использования изображений.
  6. В соответствии с номером изображения случайным образом разделите все изображения языка, поместив 70% из них в обучающий набор и 30% в тестовый набор в электронной таблице.

3. Классификация языка

  1. Перейдите на официальные сайты, скачайте и установите Anaconda, Python и Labelme. Активируйте среду и завершите установку и настройку всей среды. На рисунке 6 показана блок-схема, описывающая установку и настройку программного обеспечения.
  2. Постройте модель алгоритма глубокого обучения в установленной среде, настройте параметры и завершите обучение модели с помощью обучающего набора. Выполните выбор и настройку модели, как описано в следующих шагах.
    1. Выбор модели: Выберите подходящую модель в зависимости от цели исследования. После рассмотрения исследований по обработке изображений языка за последние 5 лет для проверки в этом исследовании были выбраны четыре алгоритма: U-Net, Seg-Net, DeeplabV3 и PSPNet (см. Файл дополнительного кодирования 1, Файл дополнительного кодирования 2, Файл дополнительного кодирования 3 и Файл дополнительного кодирования 4 для кодов моделей).
    2. Построение набора данных: После завершения выбора модели сконструируйте необходимый набор данных в сочетании с содержанием исследования, в основном используя аннотацию Labelme и методы равномерного размера изображения, как описано выше.
  3. Выполните обучение модели, как описано ниже. На рисунке 7 показана подробная информация об операции обучения алгоритма.
    1. Введите данные в нейронную сеть для прямого распространения, при этом каждый нейрон сначала вводит взвешенное накопление значений, а затем вводит функцию активации в качестве выходного значения этого нейрона для получения результата.
    2. Введите результат в функцию ошибки и сравните его с ожидаемым значением, чтобы получить ошибку и судить о степени распознавания по ошибке. Чем меньше функция потерь, тем лучше будет модель.
    3. Уменьшите погрешность за счет обратного распространения и определите вектор градиента. Отрегулируйте веса по вектору градиента в соответствии с тенденцией к результатам, чтобы погрешность стремилась к нулю или уменьшалась.
    4. Повторяйте этот процесс обучения до тех пор, пока набор не будет завершен или значение ошибки больше не уменьшится, после чего обучение модели будет завершено. На рисунке 8 показана блок-схема модели алгоритма при обучении и тестировании.
  4. Протестируйте четыре модели, используя одни и те же тестовые данные для сегментации, и оцените производительность модели в соответствии с эффектом сегментации. Четыре показателя точности, запоминания, средней точности пикселей (MPA) и MIoU обеспечивают более полную оценку производительности модели.
  5. После того, как результаты четырех моделей сгенерированы, сравните их значения по горизонтали; Чем выше значение, тем выше точность сегментации и тем выше производительность модели. Смотрите Рисунок 9, Рисунок 10 и Рисунок 11.

Результаты

Результаты сравнения см. на рисунке 12, рисунке 13 и в таблице 1, где среда, построенная в этом исследовании, использует одни и те же образцы для обучения и тестирования модели алгоритма. Индикатор MIoU: U-Net > Seg-Net > PSPNet > DeeplabV3; Индикатор MPA: U-Net > Seg-Net > PSPNet >...

Обсуждение

Исходя из результатов сравнения, представленных выше, видно, что характеристики четырех рассматриваемых алгоритмов разнообразны, а их явные преимущества и недостатки описаны ниже. Структура U-Net, основанная на модификации и расширении полной сверточной сети, может получать контекстну?...

Раскрытие информации

У авторов нет конфликта интересов, о котором можно было бы заявить.

Благодарности

Эта работа была поддержана Национальным фондом природы Китая (грант No 82004504), Национальной программой ключевых исследований и разработок Министерства науки и технологий Китая (грант No 2018YFC1707606), Управлением китайской медицины провинции Сычуань (грант No 2021MS199) и Национальным фондом природы Китая (грант No 82174236).

Материалы

NameCompanyCatalog NumberComments
CPUIntel(R) Core(TM) i7-9700K
GPU NVIDIA GeForce RTX 3070 Ti (8192MB)
Operating systemsMicrosoft Windows 10 Professional Edition (64-bit)
Programming languagePython
RAM16G

Ссылки

  1. Jiu, G., et al. Effects of herbal therapy on intestinal microbiota and serum metabolomics in different rat models of Mongolian medicine. Evidence-Based Complementary and Alternative. 2022, 7255780 (2022).
  2. Xi, J., Xin, Y., Teregle, Study on the correlation between the animal model of Mongolian medicine 34;Xieri disease" and serum ALT and AST. Electronic Journal of Cardiovascular Diseases in Combination of Traditional Chinese. 4 (33), 134-135 (2016).
  3. Yin, L., et al. Study on the mechanism of serum differential protein changes in bronchial asthma based on proteomics. Chinese Journal of Traditional Chinese Medicine. 47 (22), 6227-6234 (2022).
  4. Wang, X. H., Bao, L. Band Seed. The origin and development of tongue diagnosis in Mongolian medicine. Chinese Ethnic Folk Medicine. (1), 64-65 (2008).
  5. Yang, S., et al. A comparative study on the feature parameters of tongue diagnosis images in five nationalities. Chinese Journal of Traditional Chinese Medicine. 36 (11), 6428-6430 (2021).
  6. He, J. Y., et al. Efficacy and safety of Chou-Ling-Dan granules in the treatment of seasonal influenza via combining Western and traditional Chinese medicine, protocol for a multicentre, randomised controlled clinical trial. BMJ Open. 9 (4), e024800 (2019).
  7. Wang, D. J., et al. Scientific knowledge mapping and visualization analysis in the field of Chinese medicine tongue feature objectification research. World Science and Technology - Modernization of Chinese Medicine. 23 (9), 3032-3040 (2021).
  8. Yuan, S. M., Qian, P., Li, F. F. Research progress of color correction methods for tongue and face diagnosis in traditional Chinese Medicine. Chinese Journal of Traditional Chinese Medicine. 34 (9), 4183-4185 (2019).
  9. Kanawong, R., et al. Tongue image analysis and its mobile app development for health diagnosis. Advances in Experimental Medicine and Biology. 1005, 99-121 (2017).
  10. Yu, Y., et al. Semantic segmentation evaluation index and evaluation method. Computer Engineering and Application. , (2023).
  11. Sehyung, L., Negishi, M., Urakubo, H., Kasai, H., Ishii, S. Mu-net: Multi-scale U-net for two-photon microscopy image denoising and restoration. Neural Networks. 125, 92-103 (2020).
  12. Huang, X. M., et al. A review on the application of U-Net and its variants in medical image segmentation. Chinese Journal of Biomedical Engineering. 41 (5), 567-576 (2022).
  13. Lu, J. H., Xu, Y. F., Wang, Y. Q., Hao, Y. M. Research overview of tongue objectification in traditional Chinese medicine based on computer image technology. World Science and Technology - Modernization of Traditional Chinese Medicine. 24 (11), 4568-4573 (2022).
  14. Mansour, R. F., Althobaiti, M. M., Ashour, A. A. Internet of things and synergic deep learning based biomedical tongue color image analysis for disease diagnosis and classification. IEEE Access. 9, 94769-94779 (2021).
  15. Cai, Y. H., Hu, S. B., Guan, J., Zhang, X. F. Analysis of the development and application of tongue diagnosis objectification techniques in Chinese medicine. World Science and Technology - Modernization of Chinese Medicine. 23 (7), 2447-2453 (2021).
  16. Ghosh, S., Das, N., Nasipuri, M. Reshaping inputs for convolutional neural network: some common and uncommon methods. Pattern Recognition. 93, 79-94 (2019).
  17. Shang, Z. M., et al. Research progress of digital acquisition and characterization of tongue diagnosis information. Chinese Journal of Traditional Chinese Medicine. 36 (10), 6010-6013 (2021).
  18. Ning, J., Zhang, D., Wu, C., Yue, F. Automatic tongue image segmentation based on gradient vector flow and region merging. Neural Computing and Applications. 21, 1819-1826 (2012).
  19. Zheng, F., Huang, X. Y., Wang, B. L., Wang, Y. H. A method for tongue detection based on image segmentation. Journal of Xiamen University. 55 (6), 895-900 (2016).
  20. Li, Y. T., Luo, Y. S., Zhu, Z. M. Deep learning-based tongue feature analysis. Computer Science. 47 (11), 148-158 (2020).
  21. Wang, Y. D., Sun, C. H., Cui, J. L., Wu, X. R., Qin, Y. X. Research on deep learning-based tongue fissure segmentation algorithm. World Science and Technology - Modernization of Chinese Medicine. 23 (9), 3065-3073 (2021).
  22. Wang, X. M., Wang, R. Y., Guo, D., Lu, S. Z., Zhou, P. Research on the identification method of tongue punctures based on auxiliary light source. Journal of Sensing Technology. 29 (10), 1553-1559 (2016).
  23. Yang, J. D., Zhang, P. A fully connected neural network based on migration learning for tongue image classification. Journal of the Second Military Medical University. 39 (8), 897-902 (2018).
  24. Song, C., Wang, B., Xu, J. T. Research on tongue feature classification method based on deep migration learning. Computer Engineering and Science. 43 (8), 1488-1496 (2021).
  25. Ding, H. J., He, J. C. Study on modern techniques and methods of tongue diagnosis. Shi Zhen Chinese Medicine. 21 (5), 1230-1232 (2010).
  26. Zhai, P. B., et al. A multi-stage tongue image classification algorithm incorporating attention mechanism. Computer Engineering and Design. 42 (6), 1606-1613 (2021).
  27. Hou, Y. S. A new clustering analysis algorithm based on deep learning. Journal of Xinxiang University. 35 (12), 4 (2018).
  28. Shi, Y. L., et al. A decision tree algorithm for classification of non-small cell lung cancer evidence based on tongue and pulse data. World Science and Technology - Modernization of Chinese Medicine. 24 (7), 2766-2775 (2022).
  29. Li, J., Hu, X. J., Zhou, C. L., Xu, J. T. Study on the feature analysis and diagnosis model of diabetic tongue based on random forest algorithm. Chinese Journal of Traditional Chinese Medicine. 37 (3), 1639-1643 (2022).
  30. Chen, C. H., et al. The characteristics of the combination of the four diagnostic methods of traditional Chinese medicine from the perspective of the differences between Chinese and Western medical diagnosis methods. Journal of Guangzhou University of Traditional Chinese Medicine. 28 (3), 332-334 (2011).
  31. Chen, R., et al. Correlation analysis of tongue image and western medicine typing in 382 patients with novel coronavirus pneumonia based on Lab colour model and imaging histology. Chinese Journal of Traditional Chinese Medicine. 36 (12), 7010-7014 (2021).
  32. Ju, J. W., Jung, H., Lee, Y. J., Mun, S. W., Lee, J. H. Semantic segmentation dataset for AI-based quantification of clean mucosa in capsule endoscopy. Medicina. 58 (3), 397 (2022).
  33. Wu, X., et al. A review of research on deep learning in tongue image classification. Computer Science and Exploration. , 1-23 (2022).

Перепечатки и разрешения

Запросить разрешение на использование текста или рисунков этого JoVE статьи

Запросить разрешение

Смотреть дополнительные статьи

194

This article has been published

Video Coming Soon

JoVE Logo

Исследования

Образование

О JoVE

Авторские права © 2025 MyJoVE Corporation. Все права защищены