Oturum Aç

Bu içeriği görüntülemek için JoVE aboneliği gereklidir. Oturum açın veya ücretsiz deneme sürümünü başlatın.

Bu Makalede

  • Özet
  • Özet
  • Giriş
  • Protokol
  • Temsili Sonuçlar
  • Tartışmalar
  • Açıklamalar
  • Teşekkürler
  • Malzemeler
  • Referanslar
  • Yeniden Basımlar ve İzinler

Özet

Mevcut protokol, yeni bir uçtan uca göze çarpan nesne algılama algoritmasını açıklamaktadır. Karmaşık çevresel bağlamlarda göze çarpan nesne algılamanın hassasiyetini artırmak için derin sinir ağlarından yararlanır.

Özet

Göze çarpan nesne algılama, bilgisayarla görme alanında gelişen bir ilgi alanı olarak ortaya çıkmıştır. Bununla birlikte, hakim algoritmalar, karmaşık ve çok yönlü ortamlarda göze çarpan nesneleri tespit etmekle görevlendirildiğinde azalan hassasiyet sergiler. Bu acil endişenin ışığında, bu makale, karmaşık ortamlarda göze çarpan nesneleri tespit etmeyi amaçlayan uçtan uca bir derin sinir ağı sunmaktadır. Çalışma, karmaşık ortamlarda göze çarpan nesneleri tespit etmeyi amaçlayan uçtan uca bir derin sinir ağı sunuyor. Piksel düzeyinde çok ölçekli tam evrişimli ağ ve derin kodlayıcı-kod çözücü ağı olmak üzere birbiriyle ilişkili iki bileşenden oluşan önerilen ağ, nesne sınırı tanımlamasının doğruluğunu artırmak için derin ve sığ görüntü özellikleri kullanırken, çok ölçekli özellik haritalarında görsel kontrast üretmek için bağlamsal anlambilimi bütünleştirir. Tamamen bağlantılı bir koşullu rastgele alan (CRF) modelinin entegrasyonu, göze çarpan haritaların uzamsal tutarlılığını ve kontur tasvirini daha da geliştirir. Önerilen algoritma, SOD ve ECSSD veritabanlarındaki 10 çağdaş algoritmaya karşı kapsamlı bir şekilde değerlendirilmiştir. Değerlendirme sonuçları, önerilen algoritmanın kesinlik ve doğruluk açısından diğer yaklaşımlardan daha iyi performans gösterdiğini ve böylece karmaşık ortamlarda göze çarpan nesne tespitindeki etkinliğini ortaya koyduğunu göstermektedir.

Giriş

Göze çarpan nesne algılama, arka plan bilgilerini bastırırken önemli görüntü bölgelerini hızla tanımlayarak insanın görsel dikkatini taklit eder. Bu teknik, görüntü kırpma1, anlamsal segmentasyon2 ve görüntü düzenleme3 gibi görevlerde bir ön işleme aracı olarak yaygın olarak kullanılmaktadır. Arka plan değiştirme ve ön plan çıkarma gibi görevleri kolaylaştırarak düzenleme verimliliğini ve hassasiyetini artırır. Ek olarak, hedef yerelleştirmeyi geliştirerek anlamsal segmentasyona yardımcı olur. Hesaplama verimliliğini artırmak ve belleği korumak için göze çarpan nesne algılama potansiyeli, önemli a....

Protokol

1. Deney düzeneği ve prosedürü

  1. Önceden eğitilmiş VGG16 modelini yükleyin.
    NOT: İlk adım, önceden eğitilmiş VGG16 modelini Keras kitaplığından6 yüklemektir.
    1. PyTorch gibi popüler derin öğrenme kitaplıklarını kullanarak Python'da önceden eğitilmiş bir VGG16 modeli yüklemek için şu genel adımları izleyin:
      1. İthalat meşalesi. torchvision.models'i model olarak içe aktarın.
      2. Önceden eğitilmiş VGG16 modelini yükleyin. vgg16_model = models.vgg16(önceden eğitilmiş=Doğru).
      3. VGG16 modelinin özetinin "print(vgg16_model)" olduğundan emin olun.

Temsili Sonuçlar

Bu çalışma, iki tamamlayıcı ağdan oluşan uçtan uca bir derin sinir ağını tanıtmaktadır: piksel düzeyinde çok ölçekli tam evrişimli ağ ve derin kodlayıcı-kod çözücü ağı. İlk ağ, çok ölçekli özellik haritalarından görsel kontrastlar elde etmek için bağlamsal semantikiyi entegre ederek, farklı katmanlardaki derin sinir ağlarındaki sabit alıcı alanların zorluğunu ele alır. İkinci ağ, hedef nesnelerdeki bulanık sınırlar sorununu azaltmak için hem derin hem de sığ görüntü.......

Tartışmalar

Makale, karmaşık ortamlarda göze çarpan nesnelerin algılanması için özel olarak tasarlanmış uçtan uca bir derin sinir ağını tanıtmaktadır. Ağ, birbirine bağlı iki bileşenden oluşur: piksel düzeyinde çok ölçekli tam evrişimli ağ (DCL) ve derin kodlayıcı-kod çözücü ağ (DEDN). Bu bileşenler, çok ölçekli özellik haritalarında görsel kontrastlar oluşturmak için bağlamsal anlambilimi birleştirerek sinerjik olarak çalışır. Ek olarak, nesne sınırı tanımlamasının hassasiyetin.......

Açıklamalar

Yazarların açıklayacak hiçbir şeyi yok.

Teşekkürler

Bu çalışma, 2024 Henan İl Yükseköğretim Kurumları Temel Bilimsel Araştırma Projesi Destekleme Programı Kurulumu (Proje No:24A520053) tarafından desteklenmektedir. Bu çalışma aynı zamanda Henan Eyaletinde Özel Oluşturma ve Entegrasyon Karakteristik Gösteri Kursu İnşaatı tarafından da desteklenmektedir.

....

Malzemeler

NameCompanyCatalog NumberComments
MatlabMathWorksMatlab R2016aMATLAB's programming interface provides development tools for improving code quality maintainability and maximizing performance.
It provides tools for building applications using custom graphical interfaces.
It provides tools for combining MATLAB-based algorithms with external applications and languages
Processor Intel11th Gen Intel(R) Core (TM) i5-1135G7 @ 2.40GHz64-bit Win11 processor 
PycharmJetBrainsPyCharm 3.0PyCharm is a Python IDE (Integrated Development Environment)
a list of required python:
modulesmatplotlib
skimage
torch
os
time
pydensecrf
opencv
glob
PIL
torchvision
numpy
tkinter
PyTorch FacebookPyTorch 1.4 PyTorch is an open source Python machine learning library , based on Torch , used for natural language processing and other applications.PyTorch can be viewed both as the addition of GPU support numpy , but also can be viewed as a powerful deep neural network with automatic derivatives .

Referanslar

  1. Wang, W. G., Shen, J. B., Ling, H. B. A deep network solution for attention and aesthetics aware photo cropping. IEEE Transactions on Pattern Analysis and Machine Intelligence. 41 (7), 1531-1544 (2018).
  2. Wang, W. G., Sun, G. L., Gool, L. V.

Yeniden Basımlar ve İzinler

Bu JoVE makalesinin metnini veya resimlerini yeniden kullanma izni talebi

Izin talebi

Daha Fazla Makale Keşfet

M hendislikSay 202karma k ortamlaru tan ucaderin sinir a larg ze arpan nesne alg lama

This article has been published

Video Coming Soon

JoVE Logo

Gizlilik

Kullanım Şartları

İlkeler

Araştırma

Eğitim

JoVE Hakkında

Telif Hakkı © 2020 MyJove Corporation. Tüm hakları saklıdır