まず、Python でディープ ラーニング ライブラリ (PyTorch など) を読み込みます。トーチとトーチビジョンのモデルをモデルとしてインポートします。次に、事前学習済みのVCG16モデルを読み込みます。
DCL アルゴリズムの疑似コードを生成するには、イメージ データセット SOD を入力フィールドに提供し、出力フィールドとして [DCL モデルのトレーニング] を使用します。次に、VGG16 バックボーン ネットワークを使用して DCL モデルを初期化します。画像データセットを前処理し、データセットをトレーニングセットと検証セットに分割します。
DCL モデルに学習させるための損失関数を定義します。学習率としてトレーニング ハイパーパラメーターを 0.0001、設定されたトレーニング エポック数として 50、バッチ サイズとして 8、オプティマイザーとして Adam に設定します。DCL ネットワークと DEDN ネットワークの出力を結合し、全結合条件付き確率場モデルを使用して顕著性マップを調整します。
イメージを処理するには、実行コードをクリックしてGUIインターフェイスを表示します。次に、[画像を開く]を押して、検出する選択した画像を選択します。次に、[画像の表示]を押して、選択した画像を表示します。
[検出の開始]をクリックして、選択した画像を検出します。最後に、[セーフパスの選択]を押し、適切なファイルの場所を選択して画像の結果を保存します。アルゴリズムから DCL モデルを削除すると、F ベータ値が減少し、E MAE 値が増加しました。
このアルゴリズムは、DEDN 構造のみを削除します。モジュール全体と比較して、Fベータ値の同様の減少とE MAE値の増加が観察されました。DCLアルゴリズムは、SODデータベース内の画像を検出するときにターゲット境界を記述しましたが、背景を効果的にフィルタリングするのに苦労しました。
ただし、DEDN アルゴリズムはターゲット境界を強化しましたが、バックグラウンド冗長性情報は抑制しました。