A subscription to JoVE is required to view this content. Sign in or start your free trial.

Summary

ويصف هذا البروتوكول خوارزمية جديدة للكشف عن الأجسام البارزة من طرف إلى طرف. إنه يستفيد من الشبكات العصبية العميقة لتعزيز دقة اكتشاف الأشياء البارزة ضمن السياقات البيئية المعقدة.

Abstract

برز اكتشاف الأجسام البارزة كمجال اهتمام مزدهر في مجال رؤية الكمبيوتر. ومع ذلك ، تظهر الخوارزميات السائدة دقة متناقصة عند تكليفها باكتشاف الأشياء البارزة داخل بيئات معقدة ومتعددة الأوجه. في ضوء هذا القلق الملح ، تقدم هذه المقالة شبكة عصبية عميقة من طرف إلى طرف تهدف إلى اكتشاف الأشياء البارزة داخل البيئات المعقدة. تقدم الدراسة شبكة عصبية عميقة من طرف إلى طرف تهدف إلى اكتشاف الأشياء البارزة داخل البيئات المعقدة. تتألف الشبكة المقترحة من مكونين مترابطين ، وهما شبكة تلافيفية كاملة متعددة المقاييس على مستوى البكسل وشبكة فك تشفير عميقة ، وتدمج دلالات سياقية لإنتاج تباين مرئي عبر خرائط المعالم متعددة المقاييس مع استخدام ميزات الصورة العميقة والضحلة لتحسين دقة تحديد حدود الكائن. ويعزز تكامل نموذج الحقل العشوائي الشرطي المتصل بالكامل من التماسك المكاني وتحديد الكنتور للخرائط البارزة. يتم تقييم الخوارزمية المقترحة على نطاق واسع مقابل 10 خوارزميات معاصرة في قواعد بيانات SOD و ECSSD. تظهر نتائج التقييم أن الخوارزمية المقترحة تتفوق على الأساليب الأخرى من حيث الدقة والدقة ، وبالتالي تثبت فعاليتها في اكتشاف الأشياء البارزة في البيئات المعقدة.

Introduction

يحاكي اكتشاف الأجسام البارزة الانتباه البصري البشري ، ويحدد بسرعة مناطق الصورة الرئيسية مع قمع معلومات الخلفية. تستخدم هذه التقنية على نطاق واسع كأداة للمعالجة المسبقة في مهام مثل اقتصاص الصور1 والتجزئة الدلالية2 وتحرير الصور3. إنه يبسط المهام مثل استبدال الخلفية واستخراج المقدمة ، مما يحسن كفاءة التحرير والدقة. بالإضافة إلى ذلك ، فإنه يساعد في التجزئة الدلالية من خلال تعزيز توطين الهدف. إن إمكانات اكتشاف الأجسام البارزة لتعزيز الكفاءة الحسابية والحفاظ على الذاكرة تؤكد على آفاق البحث والتطبيق الهامة.

على مر السنين ، تطور اكتشاف الأشياء البارزة من الخوارزميات التقليدية ا....

Protocol

1. الإعداد التجريبي والإجراءات

  1. قم بتحميل طراز VGG16 المدرب مسبقا.
    ملاحظة: الخطوة الأولى هي تحميل طراز VGG16 المدرب مسبقا من مكتبة Keras6.
    1. لتحميل نموذج VGG16 مدرب مسبقا في Python باستخدام مكتبات التعلم العميق الشائعة مثل PyTorch (انظر جدول المواد) ، اتبع الخطوات العامة التالية:
      1. استيراد الشعلة. استيراد نماذج torchvision.models كنماذج.
      2. قم بتحميل طراز VGG16 المدرب مسبقا. vgg16_model = models.vgg16 (تم تدريبه مسبقا = صحيح).
      3. تأكد من أن ملخص طراز VGG16 هو "طباعة (vgg16_model)".
  2. تحديد نماذج DCL و DEDN....

النتائج

تقدم هذه الدراسة شبكة عصبية عميقة من طرف إلى طرف تتكون من شبكتين متكاملتين: شبكة تلافيفية كاملة متعددة المقاييس على مستوى البكسل وشبكة فك تشفير عميقة. تدمج الشبكة الأولى الدلالات السياقية لاشتقاق التناقضات البصرية من خرائط المعالم متعددة المقاييس ، ومعالجة التحدي المتمثل في الحقول المس?.......

Discussion

يقدم المقال شبكة عصبية عميقة من طرف إلى طرف مصممة خصيصا للكشف عن الأشياء البارزة في البيئات المعقدة. تتكون الشبكة من مكونين مترابطين: شبكة تلافيفية كاملة متعددة المقاييس على مستوى البكسل (DCL) وشبكة فك تشفير عميقة (DEDN). تعمل هذه المكونات بشكل تآزري ، حيث تتضمن الدلالات السياقية لتوليد تباينا.......

Disclosures

ليس لدى المؤلفين ما يكشفون عنه.

Acknowledgements

يتم دعم هذا العمل من قبل مؤسسة تمويل مشروع البحث العلمي الرئيسي لمؤسسات التعليم العالي في مقاطعة خنان لعام 2024 (رقم المشروع: 24A520053). يتم دعم هذه الدراسة أيضا من خلال بناء دورة توضيحية متخصصة في الإنشاء والتكامل في مقاطعة خنان.

....

Materials

NameCompanyCatalog NumberComments
MatlabMathWorksMatlab R2016aMATLAB's programming interface provides development tools for improving code quality maintainability and maximizing performance.
It provides tools for building applications using custom graphical interfaces.
It provides tools for combining MATLAB-based algorithms with external applications and languages
Processor Intel11th Gen Intel(R) Core (TM) i5-1135G7 @ 2.40GHz64-bit Win11 processor 
PycharmJetBrainsPyCharm 3.0PyCharm is a Python IDE (Integrated Development Environment)
a list of required python:
modulesmatplotlib
skimage
torch
os
time
pydensecrf
opencv
glob
PIL
torchvision
numpy
tkinter
PyTorch FacebookPyTorch 1.4 PyTorch is an open source Python machine learning library , based on Torch , used for natural language processing and other applications.PyTorch can be viewed both as the addition of GPU support numpy , but also can be viewed as a powerful deep neural network with automatic derivatives .

References

  1. Wang, W. G., Shen, J. B., Ling, H. B. A deep network solution for attention and aesthetics aware photo cropping. IEEE Transactions on Pattern Analysis and Machine Intelligence. 41 (7), 1531-1544 (2018).
  2. Wang, W. G., Sun, G. L., Gool, L. V.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Explore More Articles

This article has been published

Video Coming Soon

We use cookies to enhance your experience on our website.

By continuing to use our website or clicking “Continue”, you are agreeing to accept our cookies.

Learn More