Sign In

A subscription to JoVE is required to view this content. Sign in or start your free trial.

In This Article

  • Summary
  • Abstract
  • Introduction
  • Protocol
  • Representative Results
  • Discussion
  • Acknowledgements
  • Materials
  • References
  • Reprints and Permissions

Summary

Настоящий протокол описывает новый сквозной алгоритм обнаружения заметных объектов. Он использует глубокие нейронные сети для повышения точности обнаружения заметных объектов в сложных условиях окружающей среды.

Abstract

Обнаружение заметных объектов стало растущей областью интереса в области компьютерного зрения. Тем не менее, преобладающие алгоритмы демонстрируют меньшую точность, когда им поручено обнаруживать заметные объекты в сложных и многогранных средах. В свете этой насущной проблемы в данной статье представлена сквозная глубокая нейронная сеть, предназначенная для обнаружения заметных объектов в сложных средах. В исследовании представлена сквозная глубокая нейронная сеть, целью которой является обнаружение заметных объектов в сложных средах. Состоящая из двух взаимосвязанных компонентов, а именно многомасштабной полной сверточной сети на уровне пикселей и сети глубоких кодеров-декодеров, предлагаемая сеть интегрирует контекстуальную семантику для создания визуального контраста между многомасштабными картами признаков, используя при этом глубокие и поверхностные характеристики изображений для повышения точности идентификации границ объектов. Интеграция полносвязной модели условного случайного поля (CRF) еще больше повышает пространственную когерентность и контурное очерчивание карт выдающихся. Предложенный алгоритм всесторонне оценен в сравнении с 10 современными алгоритмами в базах данных SOD и ECSSD. Результаты оценки показывают, что предложенный алгоритм превосходит другие подходы по точности и достоверности, тем самым подтверждая его эффективность при обнаружении заметных объектов в сложных условиях.

Introduction

Функция обнаружения заметных объектов имитирует зрительное внимание человека, быстро определяя ключевые области изображения, подавляя фоновую информацию. Этот метод широко используется в качестве инструмента предварительной обработки в таких задачах, как обрезка изображений1, семантическая сегментация2 и редактирование изображений3. Он оптимизирует такие задачи, как замена фона и извлечение переднего плана, повышая эффективность и точность редактирования. Кроме того, он помогает в семантической сегментации, улучшая целевую локализацию. Потенциал обнаружения заметных объектов для повышения вычислит....

Protocol

1. Экспериментальная установка и процедура

  1. Загрузите предварительно обученную модель VGG16.
    ПРИМЕЧАНИЕ: Первым шагом является загрузка предварительно обученной модели VGG16 из библиотеки Keras6.
    1. Чтобы загрузить предварительно обученную модель VGG16 в Python с помо.......

Representative Results

В этом исследовании представлена сквозная глубокая нейронная сеть, состоящая из двух взаимодополняющих сетей: многомасштабной полностью сверточной сети на уровне пикселей и сети глубоких кодеров-декодеров. Первая сеть интегрирует контекстуальную семантику для получения визуальных .......

Discussion

В статье представлена сквозная глубокая нейронная сеть, специально разработанная для обнаружения заметных объектов в сложных средах. Сеть состоит из двух взаимосвязанных компонентов: многомасштабной полностью сверточной сети пиксельного уровня (DCL) и сети глубоких кодеров-декодеров .......

Acknowledgements

Эта работа поддерживается Программой финансирования ключевых научно-исследовательских проектов высших учебных заведений провинции Хэнань на 2024 год (номер проекта: 24A520053). Это исследование также проводится при поддержке Специализированного демонстрационного курса по созданию и интеграции в провинции Хэнань.

....

Materials

NameCompanyCatalog NumberComments
MatlabMathWorksMatlab R2016aMATLAB's programming interface provides development tools for improving code quality maintainability and maximizing performance.
It provides tools for building applications using custom graphical interfaces.
It provides tools for combining MATLAB-based algorithms with external applications and languages
Processor Intel11th Gen Intel(R) Core (TM) i5-1135G7 @ 2.40GHz64-bit Win11 processor 
PycharmJetBrainsPyCharm 3.0PyCharm is a Python IDE (Integrated Development Environment)
a list of required python:
modulesmatplotlib
skimage
torch
os
time
pydensecrf
opencv
glob
PIL
torchvision
numpy
tkinter
PyTorch FacebookPyTorch 1.4 PyTorch is an open source Python machine learning library , based on Torch , used for natural language processing and other applications.PyTorch can be viewed both as the addition of GPU support numpy , but also can be viewed as a powerful deep neural network with automatic derivatives .

References

  1. Wang, W. G., Shen, J. B., Ling, H. B. A deep network solution for attention and aesthetics aware photo cropping. IEEE Transactions on Pattern Analysis and Machine Intelligence. 41 (7), 1531-1544 (2018).
  2. Wang, W. G., Sun, G. L., Gool, L. V.

Explore More Articles

202

This article has been published

Video Coming Soon

JoVE Logo

Privacy

Terms of Use

Policies

Research

Education

ABOUT JoVE

Copyright © 2025 MyJoVE Corporation. All rights reserved