AI・IoT

畳み込みニューラルネットワーク(CNN)を使用した深層学習の仕組み《工場の外観検査でも大活躍》

Pocket

ディープラーニング

今回は、製造現場における外観検査の効率化等でも大きな威力を発揮する、畳み込みニューラルネットワークを用いた深層学習(ディープラーニング)の基礎知識を解説していきます。

1.深層学習(ディープラーニング)とは

一般的な機械学習(教師あり学習)では、正解を判断するための基準となるデータ(情報)とそのデータが持つ特徴を紐づけた「教師データ」を用いて、AI(人工知能)が正解値とその特徴の間の関係性/パターンを見出し、入力データが「正解=教師データ」に近似している場合に「正解」と判定を下す事前学習済みモデルを作成しますが、学習に使用する特徴(種類、量)は基本的に人間が指定することになります。

しかし、特徴を人間が指定することは必ずしも容易ではありません。例えば画像は、人が見れば何が写っている画像が明らかだとしても、コンピュータにとってみれば単なる画素(ピクセル)の集まりでしかありませんので、例えば工場における製品の外観検査で使用する画像の特徴を機械(コンピュータ)が数値的に把握しやすいデータとして人間が指定することは容易なことではありません。

この課題を解決するのが、例えば「お手本となる大量の画像データなどから、どのような特徴量を基に学習(判断モデルを生成)したら良いか」を機械(コンピュータ)自身が判断し、自ら判断モデルを生成していくのが「深層学習」(ディープラーニング)と呼ばれる機械学習です。
工場における製品の外観検査向けの深層学習(ディープラーニング)では、汚れ、歪み、シミなどなど、様々な欠陥のパターンを判別する分類器を、その手本となる大量の画像データから機械(コンピュータ)自身が生成していきます。

 

従来の機械学習とディープラーニングの比較図
【図1 従来の機械学習とディープラーニングの違い】

 

 

2.畳み込みニューラルネットワークを用いた深層学習のモデル

大量の画像データから特徴量を抽出するための深層学習(ディープラーニング)では、人間の神経細胞であるニューロンをモデル化した人工ニューロンパーセプトロン)を基本単位とする、「畳み込みニューラルネットワークCNN)」というモデルがよく利用されます。

 

ニューロンとパーセプトロンの説明図
【図2 ニューロンとパーセプトロンの説明図】

 

畳み込みニューラルネットワークの構成と学習モデル生成の流れ

畳み込みニューラルネットワーク(CNN)は、畳み込み層プーリング層全結合層から構成され、以下の流れで学習モデル(分類器)を完成することができます。

 

畳み込みニューラルネットワーク(CNN)の説明図
【図3 畳み込みニューラルネットワーク(CNN)のイメージ】
入力(評価画像)~出力(分類毎確率)の流れ

 

 

① 入力に対して局所的な特徴を抽出する(畳み込み層)

畳み込み層では「畳み込みフィルタ」(カーネル)と呼ばれる画像中の特定の形状に反応するフィルタを画像に掛け合わせることで、画像の特徴を抽出します。
畳み込みフィルタは学習によりラベルの判別に有効な形状となっており、エッジや塊(ブロブ)の有無、数、面積、位置、長さ、方向などの画像の特徴を抽出することに利用されます。

なお、入力した画像に対して畳み込みフィルタ(カーネル)を1ピクセル単位ごとにずらして掛け合わせ一致量を計算することで、畳み込みフィルタ(カーネル)との一致度合いが高い部分は強調されて写されます。
例えば、縦のフィルタ(カーネル)を通すと画像の縦方向のエッジが協調され、横のフィルタ(カーネル)を通すと画像の横方向のエッジが協調されます。
なお、1ピクセル単位ごとにずらして特徴的な部分が強調された画像を特徴マップと呼び、畳み込みフィルタの数だけ複数作成可能です。

 

② 局所毎の特徴をまとめ上げる(プーリング層)

畳み込み層で抽出された特徴の位置感度を若干低下させ、対象とする特徴量の画像内での位置が若干変化した場合でもプーリング層の出力が普遍になるようにすることで画像の空間サイズの大きさを小さくし、調整するパラメーターの数を減らし計算コスト抑制するとともに過学習を防止します。

 

③ 繰り返し処理

上記①(畳み込み層)、②(プーリング層)の出力に対する処理を繰り返します。

 

④ 特徴量の全画素の相関から分類する(全結合層)

畳み込み層やプーリング層での演算で抽出した特徴量から、全情報を取りまとめる仕組みです。
何層も積み重ねることにより複雑で有効な特徴量を利用した処理が可能となります。

また、入力画像の種類(良品、不良品など)とCNNで得たその画像の特徴量を学習することで学習モデル(分類器)が完成し、最終的に出力層に予測や分類の結果が出力されます。

 

ということで今回は、畳み込みニューラルネットワーク(CNN)を使用した深層学習(ディープラーニング)の仕組み・流れを解説しました。

 
(日本アイアール株式会社 特許調査部 M・K)

 

 

Pocket

関連するセミナー

製造業eラーニングTech e-L講座リスト

製造業向けeラーニングライブラリ

アイアール技術者教育研究所の講師紹介

製造業の新入社員教育サービス

技術者育成プログラム策定の無料相談受付中

スモールステップ・スパイラル型の技術者教育

技術の超キホン

機械設計マスターへの道

生産技術のツボ

早わかり電気回路・電子回路

品質保証塾

機械製図道場

スぺシャルコンテンツ
Special Contents

導入・活用事例

テキスト/教材の制作・販売