Un abonnement à JoVE est nécessaire pour voir ce contenu. Connectez-vous ou commencez votre essai gratuit.
Le présent protocole décrit un nouvel algorithme de détection d’objets saillants de bout en bout. Il exploite les réseaux neuronaux profonds pour améliorer la précision de la détection d’objets saillants dans des contextes environnementaux complexes.
La détection d’objets saillants est devenue un domaine d’intérêt en plein essor dans le domaine de la vision par ordinateur. Cependant, les algorithmes dominants présentent une précision réduite lorsqu’ils sont chargés de détecter des objets saillants dans des environnements complexes et à multiples facettes. À la lumière de cette préoccupation urgente, cet article présente un réseau neuronal profond de bout en bout qui vise à détecter des objets saillants dans des environnements complexes. L’étude présente un réseau neuronal profond de bout en bout qui vise à détecter des objets saillants dans des environnements complexes. Comprenant deux composants interdépendants, à savoir un réseau convolutif complet multi-échelle au niveau du pixel et un réseau encodeur-décodeur profond, le réseau proposé intègre une sémantique contextuelle pour produire un contraste visuel sur des cartes de caractéristiques multi-échelles tout en utilisant des caractéristiques d’image profondes et superficielles pour améliorer la précision de l’identification des limites d’objets. L’intégration d’un modèle de champ aléatoire conditionnel (CRF) entièrement connecté améliore encore la cohérence spatiale et la délimitation des contours des cartes saillantes. L’algorithme proposé est évalué de manière approfondie par rapport à 10 algorithmes contemporains sur les bases de données SOD et ECSSD. Les résultats de l’évaluation démontrent que l’algorithme proposé surpasse les autres approches en termes de précision et d’exactitude, établissant ainsi son efficacité dans la détection d’objets saillants dans des environnements complexes.
La détection d’objets saillants imite l’attention visuelle humaine, identifiant rapidement les régions clés de l’image tout en supprimant les informations d’arrière-plan. Cette technique est largement utilisée comme outil de prétraitement dans des tâches telles que le recadrage d’image1, la segmentation sémantique2 et l’édition d’image3. Il rationalise les tâches telles que le remplacement de l’arrière-plan et l’extraction du premier plan, améliorant ainsi l’efficacité et la précision de l’édition. De plus, il facilite la segmentation sémantique en améliorant la localisation des cibles. Le potenti....
1. Configuration et procédure expérimentales
Cette étude présente un réseau de neurones profonds de bout en bout comprenant deux réseaux complémentaires : un réseau entièrement convolutif multi-échelle au niveau du pixel et un réseau d’encodeur-décodeur profond. Le premier réseau intègre une sémantique contextuelle pour dériver des contrastes visuels à partir de cartes de caractéristiques multi-échelles, répondant au défi des champs récepteurs fixes dans les réseaux neuronaux profonds à travers différentes couches. Le deuxième réseau util.......
L’article présente un réseau neuronal profond de bout en bout spécialement conçu pour la détection d’objets saillants dans des environnements complexes. Le réseau est composé de deux composants interconnectés : un réseau entièrement convolutif (DCL) multi-échelle au niveau du pixel et un réseau encodeur-décodeur profond (DEDN). Ces composants fonctionnent en synergie, incorporant une sémantique contextuelle pour générer des contrastes visuels dans des cartes de caractéristiques multi-échelles. De pl.......
Les auteurs n’ont rien à divulguer.
Ce travail est soutenu par l’établissement du programme de financement des projets de recherche scientifique clés des établissements d’enseignement supérieur de la province du Henan de 2024 (numéro de projet : 24A520053). Cette étude est également soutenue par la création spécialisée et la construction de cours de démonstration caractéristiques d’intégration dans la province du Henan.
....Name | Company | Catalog Number | Comments |
Matlab | MathWorks | Matlab R2016a | MATLAB's programming interface provides development tools for improving code quality maintainability and maximizing performance. It provides tools for building applications using custom graphical interfaces. It provides tools for combining MATLAB-based algorithms with external applications and languages |
Processor | Intel | 11th Gen Intel(R) Core (TM) i5-1135G7 @ 2.40GHz | 64-bit Win11 processor |
Pycharm | JetBrains | PyCharm 3.0 | PyCharm is a Python IDE (Integrated Development Environment) a list of required python: modulesmatplotlib skimage torch os time pydensecrf opencv glob PIL torchvision numpy tkinter |
PyTorch | PyTorch 1.4 | PyTorch is an open source Python machine learning library , based on Torch , used for natural language processing and other applications.PyTorch can be viewed both as the addition of GPU support numpy , but also can be viewed as a powerful deep neural network with automatic derivatives . |
Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE
Demande d’autorisationThis article has been published
Video Coming Soon