Bu içeriği görüntülemek için JoVE aboneliği gereklidir. Oturum açın veya ücretsiz deneme sürümünü başlatın.
Method Article
* Bu yazarlar eşit katkıda bulunmuştur
Bu çalışma, bir dil görüntüsünü segmentlere ayırmak için U-Net ve diğer derin öğrenme algoritmalarını kullandı ve dil tanısının nesnelleştirilmesini araştırmak için segmentasyon sonuçlarını karşılaştırdı.
Dil teşhisi, geleneksel Çin tıbbı (TCM) teşhisinin temel bir tekniğidir ve görüntü işleme teknolojisi ile dil görüntülerini nesneleştirme ihtiyacı artmaktadır. Bu çalışma, son on yılda dil nesnelleştirmesinde kaydedilen ilerlemeye genel bir bakış sunmakta ve segmentasyon modellerini karşılaştırmaktadır. Gerçek dil görüntü kümelerini kullanarak algoritmaları doğrulamak ve karşılaştırmak için çeşitli derin öğrenme modelleri oluşturulmuştur. Her modelin güçlü ve zayıf yönleri analiz edilir. Bulgular, U-Net algoritmasının hassasiyet doğruluğu (PA), geri çağırma ve birleşme (MIoU) metrikleri üzerinden ortalama kesişim ile ilgili diğer modellerden daha iyi performans gösterdiğini göstermektedir. Bununla birlikte, dil görüntüsü elde etme ve işlemedeki önemli ilerlemelere rağmen, dil tanısını nesnelleştirmek için tek tip bir standart henüz belirlenmemiştir. Mobil cihazlar kullanılarak yakalanan dil görüntülerinin dil tanı nesneleştirmesinde yaygın olarak uygulanmasını kolaylaştırmak için, daha fazla araştırma karmaşık ortamlarda yakalanan dil görüntülerinin yarattığı zorlukları ele alabilir.
Dil gözlemi, geleneksel Çin etnik tıbbında (TCM) yaygın olarak kullanılan bir tekniktir. Dilin rengi ve şekli fiziksel durumu ve çeşitli hastalık özelliklerini, şiddetlerini ve prognozlarını yansıtabilir. Örneğin, geleneksel Hmong tıbbında, dilin rengi vücut ısısını tanımlamak için kullanılır, örneğin kırmızı veya mor bir dil, ısı ile ilgili patolojik faktörleri gösterir. Tibet tıbbında, bir durum hastanın dilini gözlemleyerek, mukusun rengine, şekline ve nemine dikkat ederek değerlendirilir. Örneğin, Heyi hastalığı olan hastaların dilleri kırmızı ve kaba veya siyah ve kuruolur 1; Xieri hastalığı2 olan hastaların sarı ve kuru dilleri vardır; Bu arada, Badakan hastalığı3 olan hastaların beyaz, nemli ve yumuşak bir dilivardır 4. Bu gözlemler dil özellikleri ile fizyoloji ve patoloji arasındaki yakın ilişkiyi ortaya koymaktadır. Genel olarak, dilin durumu tanı, hastalık tanımlama ve tedavi etkisinin değerlendirilmesinde hayati bir rol oynar.
Aynı zamanda, farklı etnik gruplar arasındaki farklı yaşam koşulları ve diyet uygulamaları nedeniyle, dil görüntülerindeki farklılıklar belirgindir. Rengin belirlenmesi için uluslararası bir standart temelinde kurulan Laboratuvar modeli, 1931 yılında Uluslararası Ekler Komisyonu (CIE) tarafından formüle edilmiştir. 1976'da bir renk deseni değiştirildi ve adlandırıldı. Lab renk modeli üç öğeden oluşur: L parlaklığa karşılık gelirken, a ve b iki renk kanalıdır. a, koyu yeşilden (düşük parlaklık değeri) griye (orta parlaklık değeri) parlak pembeye (yüksek parlaklık değeri) kadar renkleri içerir; b, parlak maviden (düşük parlaklık değeri) griye (orta parlaklık değeri) sarıya (yüksek parlaklık değeri) geçer. Beş etnik grubun dil renginin L x a x b değerlerini karşılaştırarak, Yang ve ark.5 , Hmong, Hui, Zhuang, Han ve Moğol gruplarının dil görüntülerinin özelliklerinin birbirinden önemli ölçüde farklı olduğunu bulmuşlardır. Örneğin, Moğollar sarı dil kaplamalı koyu dillere sahipken, Hmong'un beyaz dil kaplamalı açık dilleri vardır, bu da dil özelliklerinin bir popülasyonun sağlık durumunu değerlendirmek için tanısal bir gösterge olarak kullanılabileceğini düşündürmektedir. Ayrıca, dil görüntüleri, etnik tıbbın klinik araştırmalarında kanıta dayalı tıp için bir değerlendirme indeksi olarak işlev görebilir. O ve ark.6 , TCM tanısı için bir temel olarak dil görüntülerini kullandılar ve Çin ve Batı tıbbı ile birlikte Chou-Ling-Dan peletlerinin (TCM'de mevsimsel grip de dahil olmak üzere enflamatuar ve ateşli hastalıkları tedavi etmek için kullanılan CLD granülleri) güvenliğini ve etkinliğini sistematik olarak değerlendirdiler. Sonuçlar, dil görüntülerinin klinik çalışmalar için bir değerlendirme indeksi olarak bilimsel geçerliliğini ortaya koymuştur. Bununla birlikte, geleneksel tıp pratisyenleri genellikle dil özelliklerini gözlemlemek ve hastaların fizyolojik ve patolojik durumlarını değerlendirmek için öznelliğe güvenir ve daha kesin göstergeler gerektirir.
İnternetin ve yapay zeka teknolojisinin ortaya çıkışı, dil teşhisinin dijitalleştirilmesinin ve nesneleştirilmesinin önünü açmıştır. Bu süreç, dil görüntüsünün içeriğini yansıtan dil görüntülerinin nitel ve nesnel bir tanımını sağlamak için matematiksel modellerin kullanılmasını içerir7. İşlem birkaç adım içerir: görüntü yakalama, optik telafisi, renk düzeltme ve geometrik dönüşüm. Önceden işlenmiş görüntüler daha sonra görüntü konumlandırma ve segmentasyon, özellik çıkarma, desen tanıma vb. İçin algoritmik bir modele beslenir. Bu işlemin çıktısı, dil görüntü verilerinin son derece verimli ve kesin bir teşhisidir, böylece dil teşhisinin nesnelleştirilmesi, nicelleştirilmesi ve bilgilendirilmesi hedefine ulaşılır8. Böylece dil tanı verilerinin yüksek verimlilik ve yüksek hassasiyetle işlenmesi amacına ulaşılmaktadır. Dil tanılama bilgisine ve derin öğrenme teknolojisine dayanan bu çalışma, doktorlar için dillerin nicel özelliklerini çıkarmak, tanının güvenilirliğini ve tutarlılığını artırmak ve sonraki dil tanısı nesneleştirme araştırmaları için yöntemler sağlamak amacıyla bir bilgisayar algoritması kullanarak dil gövdesini ve dil kaplamasını dil görüntülerinden otomatik olarak ayırmıştır9.
Bu çalışma, Çin Ulusal Doğa Bilimleri Vakfı projesi olan TCM Yüz Görüntüsünün İlişkilendirme Analizine Dayalı Dinamik Değişim Kurallarının Oluşturulması projesi tarafından onaylanmıştır. Etik onay numarası 2021KL-027 olup, klinik araştırma protokolü (2021.04.12, V2.0), bilgilendirilmiş onam (2021.04.12, V2.0), denek işe alım materyalleri (2021.04.12, V2.0), çalışma vakaları ve/veya vaka sunumları, konu günlük kartları ve diğer anketler (2021.04.12, V2.0), klinik araştırmaya katılanların listesi, araştırma projesi onayı, vb. Çalışmaya katılan hastalardan bilgilendirilmiş onam alındı. Bu çalışmanın temel deneysel yaklaşımı, model segmentasyon etkilerini doğrulamak ve karşılaştırmak için gerçek dil görüntülerini kullanmaktır. Şekil 1 , dil tanı nesnelleştirmesinin bileşenlerini sunmaktadır.
1. Görüntü alma
2. Dil segmentasyonu
3. Dil sınıflandırması
Karşılaştırma sonuçları için, bu çalışma tarafından oluşturulan ortamın algoritma modelini eğitmek ve test etmek için aynı örnekleri kullandığı Şekil 12, Şekil 13 ve Tablo 1'e bakın. MIoU göstergesi: U-Net > Seg-Net > PSPNet > DeeplabV3; MPA göstergesi: U-Net > Seg-Net > PSPNet > DeeplabV3; hassasiyet göstergesi: U-Net > Seg-Net > DeeplabV3 > PSPNet; hatırlama: U-Net > Seg-Net > PSPNet > DeeplabV3. Dizin değeri ne ka...
Yukarıda sunulan karşılaştırma sonuçlarına dayanarak, incelenen dört algoritmanın özelliklerinin çeşitli olduğu ve bunların belirgin avantaj ve dezavantajlarının aşağıda açıklandığı açıktır. Tam bir evrişim ağının modifikasyonuna ve genişlemesine dayanan U-Net yapısı, bir büzülme yolu ve simetrik bir genişleyen yol aracılığıyla bağlamsal bilgi ve kesin konumlandırma elde edebilir. Her piksel noktasını sınıflandırarak, bu algoritma daha yüksek bir segmentasyon doğruluğu e...
Yazarların beyan edecekleri bir çıkar çatışması yoktur.
Bu çalışma, Çin Ulusal Doğa Vakfı (hibe no.82004504), Çin Bilim ve Teknoloji Bakanlığı Ulusal Anahtar Araştırma ve Geliştirme Programı (hibe no.2018YFC1707606), Sichuan Eyaleti Çin Tıbbı İdaresi (hibe no.2021MS199) ve Çin Ulusal Doğa Vakfı (hibe no.82174236) tarafından desteklenmiştir.
Name | Company | Catalog Number | Comments |
CPU | Intel(R) Core(TM) i7-9700K | ||
GPU | NVIDIA GeForce RTX 3070 Ti (8192MB) | ||
Operating systems | Microsoft Windows 10 Professional Edition (64-bit) | ||
Programming language | Python | ||
RAM | 16G |
Bu JoVE makalesinin metnini veya resimlerini yeniden kullanma izni talebi
Izin talebiThis article has been published
Video Coming Soon
JoVE Hakkında
Telif Hakkı © 2020 MyJove Corporation. Tüm hakları saklıdır