需要订阅 JoVE 才能查看此. 登录或开始免费试用。

本文内容

  • 摘要
  • 摘要
  • 引言
  • 研究方案
  • 代表性结果
  • 讨论
  • 披露声明
  • 致谢
  • 材料
  • 参考文献
  • 转载和许可

摘要

本协议描述了一种新型的端到端显著目标检测算法。它利用深度神经网络来提高复杂环境背景下显著目标检测的精度。

摘要

突出目标检测已成为计算机视觉领域中一个新兴的兴趣领域。然而,当任务是在复杂和多方面的环境中检测突出物体时,流行的算法表现出较低的精度。鉴于这一紧迫问题,本文提出了一种端到端深度神经网络,旨在检测复杂环境中的突出对象。该研究引入了一种端到端的深度神经网络,旨在检测复杂环境中的突出物体。该网络由像素级多尺度全卷积网络和深度编码器-解码器网络两个相互关联的组件组成,该网络集成了上下文语义,在多尺度特征图上产生视觉对比,同时采用深浅图像特征来提高目标边界识别的准确性。全连接条件随机场(CRF)模型的集成进一步增强了显著地图的空间连贯性和等高线描绘。针对SOD和ECSSD数据库上的10种现代算法,对所提出的算法进行了广泛的评估。评估结果表明,所提算法在精度和准确度方面优于其他方法,从而确立了其在复杂环境中显著目标检测的有效性。

引言

突出物体检测模仿人类的视觉注意力,快速识别关键图像区域,同时抑制背景信息。该技术被广泛用作图像裁剪1、语义分割2 和图像编辑3 等任务中的预处理工具。它简化了背景替换和前景提取等任务,提高了编辑效率和精度。此外,它还通过增强目标定位来帮助语义分割。显著目标检测在提高计算效率和节省内存方面的潜力凸显了其重要的研究和应用前景。

多年来,显著目标检测已经从最初的传统算法发展到深度学习算法的结合。这些进步的目的是缩小显著物体检测与人类视觉机制之间的差距。这导致了深度卷积网络模型的采用,用于显著目标检测的研究。Borji等人[4 ]总结并推广了大多数依赖于图像底层特征的经典传统算法。尽管检测精度有所提高,但手动经验和认知能力仍然给复杂环境中的显著物体检测带来挑战。

卷积神经网络 (CNN) 的使用在显著目标检测领域很普遍。在这种情况下,深度卷积神经网络被用于通过自主学习进行权重更新。卷积神经网络通过级联卷积层和池化层从图像中提取上下文语义,能够在更高层次上学习复杂的图像特征,这些特征在不同环境下的显著目标检测中具有更高的辨别和表征能力。

2016 年,全卷积神经网络

研究方案

1. 实验设置和程序

  1. 加载预训练的 VGG16 模型。
    注意:第一步是从 Keras库 6 加载预训练的 VGG16 模型。
    1. 要使用 PyTorch 等流行的深度学习库在 Python 中加载预训练的 VGG16 模型(请参阅 材料表),请遵循以下常规步骤:
      1. 导入 火炬。导入 torchvision.models 作为模型。
      2. 加载预训练的 VGG16 模型。vgg16_model = models.vgg16(预训练 = True)。
      3. 确保 VGG16 模型的摘要为“print(vgg16_model)”。
  2. 定义 DCL 和 DEDN 模型。
    1. 对于 DCL 算法的伪代码,请提供 输入:图像数据集 SOD输出:训练的 DCL 模型
      1. 使用 VGG16 骨干网初始化 DCL 模型
      2. 对图像数据集 D 进行预处理(例如,调整大小、归一化)。
      3. 将数据集拆分为训练集和验证集。
      4. 定义用于....

代表性结果

本研究引入了一个由两个互补网络组成的端到端深度神经网络:像素级多尺度全卷积网络和深度编码器-解码器网络。第一个网络集成了上下文语义,从多尺度特征图中推导出视觉对比,解决了跨不同层的深度神经网络中固定感受野的挑战。第二个网络利用深和浅图像特征来缓解目标对象边界模糊的问题。最后,应用全连接条件随机场(CRF)模型提高显著性图的空间相干性和等高线。

讨论

本文介绍了一种端到端深度神经网络,专门设计用于检测复杂环境中的突出物体。该网络由两个相互连接的组件组成:像素级多尺度全卷积网络 (DCL) 和深度编码器-解码器网络 (DEDN)。这些组件协同工作,结合上下文语义,在多尺度特征图中生成视觉对比。此外,它们还利用深和浅图像特征来提高物体边界描绘的精度。全连接条件随机场(CRF)模型的集成进一步增强了显著性图和等高线描绘?.......

披露声明

作者没有什么可透露的。

致谢

本研究由2024年河南省高等学校重点科研项目资助项目建立(项目编号:24A520053)资助。本研究还得到了河南省特色创意与融合特色示范课程建设的支持。

....

材料

NameCompanyCatalog NumberComments
MatlabMathWorksMatlab R2016aMATLAB's programming interface provides development tools for improving code quality maintainability and maximizing performance.
It provides tools for building applications using custom graphical interfaces.
It provides tools for combining MATLAB-based algorithms with external applications and languages
Processor Intel11th Gen Intel(R) Core (TM) i5-1135G7 @ 2.40GHz64-bit Win11 processor 
PycharmJetBrainsPyCharm 3.0PyCharm is a Python IDE (Integrated Development Environment)
a list of required python:
modulesmatplotlib
skimage
torch
os
time
pydensecrf
opencv
glob
PIL
torchvision
numpy
tkinter
PyTorch FacebookPyTorch 1.4 PyTorch is an open source Python machine learning library , based on Torch , used for natural language processing and other applications.PyTorch can be viewed both as the addition of GPU support numpy , but also can be viewed as a powerful deep neural network with automatic derivatives .

参考文献

  1. Wang, W. G., Shen, J. B., Ling, H. B. A deep network solution for attention and aesthetics aware photo cropping. IEEE Transactions on Pattern Analysis and Machine Intelligence. 41 (7), 1531-1544 (2018).
  2. Wang, W. G., Sun, G. L., Gool, L. V.

转载和许可

请求许可使用此 JoVE 文章的文本或图形

请求许可

探索更多文章

202

This article has been published

Video Coming Soon

JoVE Logo

政策

使用条款

隐私

科研

教育

关于 JoVE

版权所属 © 2025 MyJoVE 公司版权所有,本公司不涉及任何医疗业务和医疗服务。