複雑な環境下での顕著物体検出のための事前学習済みVGG16モデルを使用したDCLアルゴリズムの実装

Please note that all translations are AI generated. Click here for the English version.

128 Views

•

02:16 min

•

December 15th, 2023

DOI :

10.3791/201074-v

December 15th, 2023

•

Yu Wang¹, Zhiteng Wang²

¹Zhengzhou University of Economics and Business, ²The 713 Research Institute of CSSC

文字起こし

まず、Python でディープラーニングライブラリ (PyTorch など) を読み込みます。トーチとトーチビジョンのモデルをモデルとしてインポートします。次に、事前学習済みのVCG16モデルを読み込みます。

DCL アルゴリズムの疑似コードを生成するには、イメージデータセット SOD を入力フィールドに提供し、出力フィールドとして [DCL モデルのトレーニング] を使用します。次に、VGG16 バックボーンネットワークを使用して DCL モデルを初期化します。画像データセットを前処理し、データセットをトレーニングセットと検証セットに分割します。

DCL モデルに学習させるための損失関数を定義します。学習率としてトレーニングハイパーパラメーターを 0.0001、設定されたトレーニングエポック数として 50、バッチサイズとして 8、オプティマイザーとして Adam に設定します。DCL ネットワークと DEDN ネットワークの出力を結合し、全結合条件付き確率場モデルを使用して顕著性マップを調整します。

イメージを処理するには、実行コードをクリックしてGUIインターフェイスを表示します。次に、[画像を開く]を押して、検出する選択した画像を選択します。次に、[画像の表示]を押して、選択した画像を表示します。

[検出の開始]をクリックして、選択した画像を検出します。最後に、[セーフパスの選択]を押し、適切なファイルの場所を選択して画像の結果を保存します。アルゴリズムから DCL モデルを削除すると、F ベータ値が減少し、E MAE 値が増加しました。

このアルゴリズムは、DEDN 構造のみを削除します。モジュール全体と比較して、Fベータ値の同様の減少とE MAE値の増加が観察されました。DCLアルゴリズムは、SODデータベース内の画像を検出するときにターゲット境界を記述しましたが、背景を効果的にフィルタリングするのに苦労しました。

ただし、DEDN アルゴリズムはターゲット境界を強化しましたが、バックグラウンド冗長性情報は抑制しました。

さらに動画を探す

JoVE

シリーズから

深層ニューラルネットワークを使用した突出物体検出の精度向上