E資格問題にチャレンジ!本日のお題は「FCN」
問題
[問題]
以下のうち、FCNについて誤っているものはどれか。
(A) FCNは、畳み込み層のみで構成され、全結合層を含まない。
(B) 特徴マップをアップサンプリングすることで、元の画像サイズに復元する。アップサンプリングには、拡張畳み込みが使用される。
(C) 低レベルの詳細な特徴と高レベルの抽象的な特徴を組み合わせにより、セグメンテーションの精度を向上させる。
(D) FCNは畳み込み層を用いたエンコーダーとデコーダーの組み合わせによって、画像全体のセグメンテーションが可能となる。
答え
B
解説
FCN(Fully Convolutional Network)は、画像セグメンテーション(画像の各ピクセルを異なるクラスに割り当てるタスク)に使用されるディープラーニングモデルの一種です。FCNは、畳み込み層のみで構成され、全結合層を含まない点が通常のCNNと異なります。したがって、(A)は正しい記述です。
FCNの主なアーキテクチャは以下の通りです:
- 特徴抽出器(エンコーダー): 通常、Imagenetなどの大規模データセットで事前学習されたCNNモデル(例:VGG16、ResNet)を特徴抽出器として使用します。この特徴抽出器は、画像から特徴マップを抽出する役割を担います。
- アップサンプリング(デコーダー): 最終の特徴マップ(下図のpool5)をアップサンプリングすることで、元の画像サイズに復元します。アップサンプリングには、逆畳み込み(転置畳み込み)などが使用されます。これにより、ピクセルごとのセグメンテーションが可能になります。したがって、(B)は誤った記述です。
- スキップコネクション: 特徴抽出器で、Pooling 層を通したり、stride を大きく取って画像サイズを小さくしてしまうことで、画像の詳細な輪郭情報が損なわれてしまいます。そこで特徴抽出器の中間の高解像度の特徴マップ(例えば下図pool4)と低解像度の特徴マップ(例えば下図pool5)をアップサンプリングした特徴マップを足し合わせたものをアップサンプリングして元のサイズに復元する工夫がなされます。これにより、低レベルの詳細な特徴と高レベルの抽象的な特徴を組み合わせることができ、セグメンテーションの精度が向上します。したがって、(C)は正しい記述です。
FCNの特徴は、畳み込み層を用いたエンコーダーとデコーダーの組み合わせによって、画像全体のセグメンテーションが可能となる点です。従来のCNNでは、全結合層による特徴マップからのクラス分類が行われますが、FCNでは全結合層を用いず、アップサンプリングされた特徴マップからのピクセルごとのクラス分類が行われます。したがって、(D)は正しい記述です。
FCNは、セマンティックセグメンテーションやインスタンスセグメンテーションなど、さまざまなセグメンテーションタスクに応用されています。スキップコネクションの導入や特徴抽出器としての事前学習済みモデルの活用により、より高い精度のセグメンテーション結果を得ることができます。
コメント