dポイントプレゼントキャンペーン実施中!

画像解析をCNNで行う場合で,画像を畳み込む時に用いるフィルターの決め方について3点ご教授ください.
フィルターの種類には,エッジ抽出,コーナー抽出,ぼかし(平滑化)等,いろいろなものがあると思います.
<1点目の質問>
どのフィルターを用いるのかは,画像の特徴を考慮して,分析者(つまり,人間)が経験的に決めるのでしょうか.また,その場合には,いろいろなフィルターを単独,もしくは組み合わせで試してみて,最も良さそうなものを分析者が採用するのでしょうか.

<2点目の質問>
1点目の質問に関係しますが,畳み込むフィルターは単独で用いるのか,複数を組み合わせて用いるのか,事前に決める方法はあるのでしょうか.もしくは,いろいろ試してみて経験的に決めるのでしょうか.

<3点目の質問>
CNNの専門書を読むと,近年ではフィルター自体を機械学習して自動的に決定する,という記述があるのですが,そこで決定されたフィルターとは,どのような特徴を抽出しているのでしょうか.前述したエッジ抽出やコーナー抽出等とは,概念的に全く異なるフィルターとなるのでしょうか.

論点が抽象的で申し訳ないですが,詳しい方,ご教授いただけると幸いです.

A 回答 (2件)

企業で統計の推進を担当している者です。



1.フィルタは主に勾配フィルタやエッジ抽出の3×3フィルタで、縦横4方向斜め4方向などです。全部で10個以上k個使用します。フィルタはフレームワークに組み込まれていますので、ユーザーはあまり意識しなくても良いです。1枚の画像からk枚の特徴画像が生成されます。各画像をプーリングして1/9のサイズにします。これを繰り返し特徴の強さの情報に縮約し、多段のニューラルネットワークの入力ノードへつなぎます。

2.複数(k個)使用します。多数使用すればするほど良いですが、メモリを食います。不特定の画像に対応させるために、一般的には決め打ちせずに多数用います。

3.どんな特徴を抽出しているかというと、例えば左から右へ強くなる濃度勾配を持つ領域があるとかいう学習する画像の特徴を抽出しています。学習する画像にない特徴は抽出する必要がないので、フィルタを選択することにより計算速度が向上します。例えば文字のような二値画像は濃度勾配が無いのでエッジだけで良いとかです。また、これらは一般的な画像処理のフィルタです。概念的に新しいものではありません。
    • good
    • 0
この回答へのお礼

kamiyasiro様
分かりやすいご回答,ありがとうございます.
すみませんが,3番目の質問に関して,更にもう1点質問させてください.
フィルター自体を機械学習して最適値を決める,という記述をしている書籍を何冊か見ました.
これの意味するところは,下記のような感じでしょうか.
➀どのようなフィルターを何種類用いるのかを分析者が事前に決めて,具体的なフィルター値の最適値が機械学習で自動的に決まる.
➁分析者が事前に決めるものは何もなく,対象画像に対して最適な複数種類のフィルター値が機械学習で自動的に決まる.

まずは実践してみないと理解できないと分かっているのですが,なかなかそこまで行っておらず,漠然とした質問で恐縮です(➀だろうなと予想しているのですが).
宜しくお願いします.

お礼日時:2020/07/06 13:05

#1です。



「フィルター自体を機械学習して・・・」のくだりを、どの本でも良いですから、もう少し正確に書いて頂けませんか。ストライドとかパディングと呼ばれる量は、画像の大きさなどから調整しますが、フィルタの3×3の行列に入る値を変更するということですか。この値を変更したところで、マックスプーリングすれば一緒だと思いますがね。
    • good
    • 0
この回答へのお礼

ご回答,ありがとうございます.
行列に入る値を逆伝播で変更する,と勝手に解釈していたのですが,もう一度書籍に当たって再考してみます.
ありがとうございました.

お礼日時:2020/07/06 15:11

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!