Bu protokol, dil görüntülerini bölümlere ayırmak için derin öğrenme algoritması kullanır ve dili otomatik olarak tüm görüntüden ayırır, bu da daha fazla araştırma için kullanılabilir. Bu protokol, bir dili net bir sayaçla segmentlere ayırabilen temel algoritmayı seçmek için dört dilli görüntü segmentasyon algoritmasının performansını karşılaştırır. Bu çalışmada patentli aletler ve algoritmalar kullanılmıştır.
Profesyonel aletlerin ve ana bilgisayar teknolojisinin kullanılması tavsiye edilir. Başlamak için, hastaların lingual yüz görüntülerini toplamak için kendi geliştirdiği el tipi lingual yüz teşhis cihazını hazırlayın. Bilgisayar sayfasında hastanın adını, cinsiyetini, yaşını ve hastalığını girin.
Ardından, hastadan dik oturmasını ve bilgisayara bağlı görüntü alma cihazını konumlandırmasını isteyin. Ardından, hastanın yüzünü görüntü toplama cihazına yerleştirin ve dillerini ağızlarından maksimum ölçüde uzatmalarını isteyin. Bilgisayar ekranındaki görüntülerle hastanın doğru pozisyonda olduğunu ve dilin ve yüzün tamamen açıkta olduğunu doğrulayın.
Üç görüntü yakalamak için bilgisayar ekranındaki çekim düğmesine üç kez basın. Ardından, yüzün ve dilin toplanan görüntülerini manuel olarak seçin. Bunları yazılımın Görüntü Alma sayfasına göre filtreleyin.
Her hastadan aynı anda üç görüntü toplayın ve görüntüleri manuel tarama için bir klasöre aktarın. Ardından, algoritma eğitimi ve testi için standart, tamamen pozlanmış, iyi aydınlatılmış ve net bir görüntü seçin. Standart görüntü ölçütlerini karşılamayan görüntüleri silin.
Dışlama kriterleri eksik dil ve yüz pozlaması ve çok karanlık görüntülerdir. Dil görüntüsü segmentasyonu gerçekleştirmek için LabelMe'yi açın ve arayüzün sol üst köşesindeki Aç düğmesine tıklayın. Segmentlere ayrılacak görüntüyü içeren klasörü seçin ve fotoğrafları açın.
Noktaları izlemek için Poligon Oluştur düğmesini tıklatın. Dil ve dil şekillerini izleyin, seçilen alanlara göre adlandırın ve kaydedin. Tüm izlemeyi bitirdiğinizde, görüntüyü veri klasörüne kaydetmek için Kaydet'i tıklatın.
Cihazı 1080x1920 piksel boyutunda görüntüler yakalayacak şekilde ayarlayın ve doldurulan görüntünün boyutunun 1920x1920 piksel olduğundan emin olun. Konunun yanıp sönmesi ve lens bloke edilmesi gibi kontrol edilemeyen faktörler için çekilen üç görüntüden birini seçmek ve saklamak için her hastanın görüntülerini manuel olarak tarayın. Modeli eğitmek için 200 kişiden veya 600 görüntüden veri toplayın ve taramadan sonra kullanılabilecek yaklaşık 200 görüntüyü saklayın.
Tüm dil görüntülerini görüntü numarasına göre rastgele bölün, bunların %70'ini Eğitim Seti'ne ve %30'unu Test Seti klasörüne yerleştirin. Anaconda Python ve LabelMe'yi resmi web sitelerinden indirin ve yükleyin. Ortamı etkinleştirin ve genel ortamın kurulumunu ve ayarlanmasını tamamlayın.
Araştırma amacına uygun modeli seçin. Bu çalışmada doğrulama için UNet, SegNet, DeepLab Sürüm 3 ve PSPNet seçilmiştir. Ardından, yüklü ortamda derin öğrenme algoritması modelini oluşturun.
Değerleri ayarlayarak parametreleri ayarlayın ve Eğitim Kümesini kullanarak model eğitimini tamamlayın. LabelMe ek açıklamasını ve tek tip görüntü boyutu yöntemlerini kullanarak, araştırma içeriğiyle birlikte gerekli veri kümesini oluşturun. Segmentasyonun sonuçlarını inceleyin ve daha kapsamlı bir değerlendirme elde etmek için model performansını dört metriğe, hassasiyete, geri çağırmaya, ortalama piksel doğruluğuna veya MPA'ya ve MIOU'ya göre değerlendirin.
Dört modelin oluşturulan değerlerini karşılaştırın. Değer ne kadar yüksek olursa, segmentasyon doğruluğu o kadar yüksek olur ve modelin performansı o kadar iyi olur. İndeks sonuçlarına göre, UNet algoritması MIOU, MPA, hassasiyet ve geri çağırmadaki diğer algoritmalardan üstündür ve segmentasyon doğruluğu da daha yüksektir.
PSPNet, MIOU, MPA ve geri çağırmada DeepLab Sürüm 3'ten daha iyidir, DeepLab Sürüm 3 modeli ise tüm dizinlerde segment modelinden daha düşüktür. Dil segmentasyonunda, görüntüdeki dış kırmızı alan dil segmentasyonundan, iç yeşil alan ise dil kaplama segmentasyonundan kaynaklanır. Bu çalışmada, birim algoritması dil segmentasyonunda iyi performans göstermiştir ve birim algoritmalarına dayanarak daha fazla araştırma yapılabilir.