1日1分 E資格問題 No.13「GoogLeNet」

E資格問題

E資格問題にチャレンジ!本日のお題は「GoogLeNet」

問題

[問題]
以下のうち、GoogLeNetについて誤っているものはどれか。

(A) 1×1、3×3、5×5のフィルターサイズを持つ畳み込み層とプーリング層を並列に実行し、それらを足し合わせるInceptionモジュールを用いている。
(B) 最終的な分類層の前には、グローバル平均プーリング層が配置されている。
(C) GoogLeNet では、各畳み込み計算を行う前に1×1畳み込みを行い、パラメーター数を削減している。
(D) 補助的分類器と呼ばれるサブネットワークにおいても予測を行い、そこからも逆伝播させることで勾配消失を回避している。

答え

 

 

 

A

解説

GoogLeNetは、Googleが開発した畳み込みニューラルネットワーク(Convolutional Neural Network, CNN)の一種です。GoogLeNetは、2014年にILSVRC(ImageNet Large Scale Visual Recognition Challenge)で優勝したモデルとして知られており、高い性能と効率性を備えています。

GoogLeNetは、従来のCNNモデルよりも深いネットワークを持ちながら、計算量とパラメータ数を効果的に削減することに成功しました。これは、GoogLeNetがInceptionモジュールと呼ばれる特殊な構造を使用しているためです。

Inceptionモジュールは、複数の畳み込み層とプーリング層を並列に配置し、それらの出力を結合することで情報を集約します。具体的には、1×1、3×3、5×5のフィルターサイズを持つ畳み込み層とプーリング層を並列に実行し、それらの出力をチャネル方向に連結します。このような並列構造により、ネットワークは異なるサイズのフィーチャーマップを効果的に抽出できます。したがって、(A)は誤った記述です。

GoogLeNetでは、Inceptionモジュールを複数組み合わせることで、モデルの深さを増やしつつ、計算量とパラメータ数を効率的に制御しており、さらに各畳み込み計算を行う前に1×1畳み込みを行い、パラメーター数を削減している。したがって、(C)は正しい記述です。

また、最終的な分類層の前には、グローバル平均プーリング層が配置されています。これにより、モデルは特徴マップ全体から1つの値を抽出し、それを入力として使用して最終的な分類を行います。したがって、(B)は正しい記述です。

さらにネットワークの途中から補助的分類器と呼ばれるサブネットワークにおいても予測を行い、そこからも逆伝播させることで勾配消失を回避している。したがって、(D)は正しい記述です。

GoogLeNetは、ILSVRCの画像分類タスクで優れた性能を発揮し、同時に効率性も示しました。このモデルは、異なる種類の画像タスクにも応用可能であり、転移学習や軽量化などの応用研究でも広く使用されています。

GoogLeNetの登場は、ディープラーニングの分野において、モデルの設計と効率性の両方を考慮する重要な進展となりました。このアーキテクチャの派生版や応用研究が続いており、より高度なビジョンタスクの解決に貢献しています。

E資格の勉強方法はコチラも参考にしてみてください。

より詳細に学びたいならキカガクの「AI人材育成長期コース」がオススメ!まずは無料相談から。

コメント

タイトルとURLをコピーしました