《ビッグデータ解析とは》主な解析手法、課題、製造業への応用について解説
近年、「ビッグデータ解析」という概念が注目を浴びています。
そして社会の様々な場面で応用が広がっています。
このビッグデータ解析の流れは製造業でも例外ではありません。
ここでは、ビッグデータ解析とは何か、ビッグデータ解析の具体例、ビッグデータ解析の課題、そして、最後にビッグデータ解析の製造業への応用について簡単に解説します。
目次
1.ビッグデータ解析とは?
(1)ビッグデータとは?
ビッグデータとは、人間や一般的なコンピュータでは全体を把握することが困難な巨大なデータのことです。
近年、インターネットの発達によって個人レベルで様々な情報が発信されるようになっています。
また、人間による情報発信だけでなく、例えば生産現場の検査の自動化などにより、機械が大量の情報を自動的に生成するようになってきています。
一方、たくさんのデータを整理してデータの傾向を掴むことや、あるいは、予測を立てることはかなり昔から行われてきました。そして、これらのデータ分析をコンピュータに行わせることも行われてきました。
そして、近年のコンピュータ技術の急激な発達により、より大量のデータを処理することが可能となり、この大量のデータを「ビッグデータ」と呼ぶようになったのです。
(2)ビッグデータ解析とは
ビッグデータ解析とは「ビッグデータを解析して、有用な知見を見出すこと、あるいはそのための技術」のことです。
ビッグデータには、「5つのV」と呼ばれる、Volume(量)、Variety(多様性)、Velocity(速度あるいは頻度)、Veracity(正確性)、Value(価値)を備えているために、ビッグデータの解析結果次第では効果的な情報を引き出すことができると考えられています。
【表1 ビッグデータ「5つのV」】
また、ビッグデータから有用な知見を引き出す手法を「データマイニング」といいます。「マイニング」とは英語で「採掘」のことです。
ビッグデータを基に価値ある知識へと広げていく様子が、「鉱脈」から「資源」を掘り取る様子に似ているためにこう呼ばれます。
現代においては、ビッグデータという「鉱脈」から取り出された有用な知見という「資源」こそが、社会課題の解決や、企業の売り上げ拡大といった貢献につながっているのです。
2.ビッグデータ解析の具体的な手法
ビッグデータ解析の手法であるデータマイニングには、様々な種類があります。
目的に応じてこれらを使い分けて解析を行います。
ここでは、代表的な「多変量解析」について簡単にご紹介します。
(1)多変量解析とは
多変量解析は、多数のデータから結果を予測したり、二つのデータの関係を分析したりする手段です。
「最小二乗法」などが一般的によく知られています。
ビッグデータを多変量解析してできることとして以下の例があげられます。
- アンケート結果の解析:アンケートの結果を解析することで、商品の強み・弱みを知ることや市場における自社・競合の立ち位置を知ることができます。
- 身体測定のデータ解析:身体測定のデータを解析することで、将来病気になる確率を調査することが可能です。
- 既存店舗の売上や顧客数データの解析:既存店舗の売上や顧客数のデータを解析することで、新店舗の将来の売上を予測することなどができます。
《多変量解析の目的》
多変量解析の目的には「予測」と「要約」の2つがあります。
予測は、測定データから未来の出来事を予測することです。
例えば、大学入学センター試験の得点値と大学の偏差値から合格の可能性を予測することなどです。
予測を目的とした多変量解析の代表的なものには、「回帰分析」や「重回帰分析」などがあり、すでに述べた「最小二乗法」も回帰分析の一種です。
要約は、多数のデータを整理し分かりやすくすることです。
例えば、国語や社会、英語のテスト結果から理系向きか文系向きかを判断することです。
「クラスター分析」や「主成分分析」などは要約を目的とした多変量解析です。
【表2 主な多変量解析の種類】
(2)回帰分析・重回帰分析
回帰分析とは、関数をデータに当てはめることによって、ある変数yの変動を別の変数xの変動により説明・予測・影響関係を検討するための手法です。
すなわち、すでに存在する測定値から関数(回帰式)を求め、この関数から未知のデータ間の関係を予測するという解析手法です。
回帰分析では多くの場合、回帰式は一次関数の形で表されます。
すなわち、yとxの関係は一対一で対応しています。
これに対して重回帰分析では、yに対して、xは複数存在します。
つまり、yに影響を及ぼす因子xは複数存在するということになります。
したがって、重回帰分析では、yに影響をあたえる因子xを複数考慮する必要があります。
もっとも、この考慮の作業は定型的なアルゴリズムが確立しているので、コンピュータによって行うことができます。ですから、近年のコンピュータの飛躍的な処理能力の向上にともなって、大規模な回帰分析・重回帰分析を行うことが可能になっています。
(3)クラスター分析
クラスター分析は、データ全体の中から似たもの同士をグループ分けする方法です。
クラスター分析の目的は、大量のデータを単純化して考察することです。
この単純化のアルゴリズムも形成されており、コンピュータを使うことによって大量のデータを効率よく分析することができます。
クラスター分析には、細かく分けると様々な手法があり、データの種類や量によって適切な手法を使い分けます。そのため、適切な分析結果を得るためには、ある程度の経験と試行錯誤が必要な場合があります。
また、各クラスターの特徴を人間が考察する必要があります。
(4)主成分分析
主成分分析は、たくさんの変数を、より少ない指標や合成された変数に要約する手法です。
要約した変数のことを「主成分」と呼びます。
主成分分析は、データの持つ意味を最大限活かしながら少数のデータに要約することができる点がメリットです。これにより図表化がしやすくなり、データの整理や解釈がしやすくなります。
また、主成分を求めるアルゴリズムも構築されています。
主成分分析は、アルゴリズムが比較的単純という特徴があります。このため膨大なデータを高速で処理することができ、多くの分野で使われています。
但しクラスター分析と同様に、主成分分析で得られた「主成分」の意味は人間が考察しなければなりません。
3.ビッグデータ解析の課題
ここで、ビッグデータ解析の課題について説明します。
ビッグデータ解析の最大の問題点は「人」の問題です。
ビッグデータ解析を行う専門家を「データサイエンティスト」といい、ビッグデータを含んだデータ解析の学問分野を「データサイエンス」といいます。
なお、データサイエンティストはアメリカのビジネス雑誌で「21世紀において最も魅力的な職業」と紹介されたことで話題になりました。
データサイエンスは極めて広い領域にまたがる学際的な分野で、数学(統計学)、ビジネス・経営学(業務や市場の動向、マーケティング)、IT(プログラミング・人工知能)などの知識が必要とされます。
したがって、データサイエンティストには極めて広範囲で深い見識が求められます。
また、ビッグデータの解析結果から現象を読み解く深い洞察力も要求されます。
また、すべての分野の知識を一人で有している天才的なデータサイエンティストは極めて少ないため、それぞれの分野の専門家が集まりチームを作って議論しながら進めていくのが現状です。そのため、コミュニケーション能力も必要となります。
このようなジェネラリストとスペシャリストの両方の要素を兼ね備えている人財は一朝一夕では育成できず、データサイエンティストは不足しています。それゆえに、実力のあるデータサイエンティストの年収は高く設定されることが多いです。
4.ビッグデータ解析と製造業
最後に、製造業におけるビッグデータ活用について見ていきましょう。
近年、製造業のDX(デジタルトランスフォーメーション)が叫ばれています。
その一環として、今まで熟練技術者の経験と勘に頼っていた業務をコンピュータに代行させる「生産の知能化」が検討されるようになってきています。
ビックデータの活用が不可欠な理由、活用の具体例
「生産の知能化」には、業務を可能な限りデータ化することで、コンピュータでの処理をしやすくし、人間の手間を極力少なくするという目的があります。
データ化した情報を人工知能で処理することにより、今まで人間の判断を必要としていた業務を機械化することが最終的な狙いとなります。これを「データドリブン化」といいます。
これは一見すると、人工知能が人間の仕事を奪ってしまうように見えますが、経験の豊富な熟練技術者の人数が減少しており、生産活動をこれからも維持していくためには必須となっています。
具体的には、装置や設備にセンサを取り付けてデータを収集し、このデータを人工知能や多変量解析によりビッグデータ解析を行うようにします。
これにより、データを「見える化」でき新たな予測を得ることで、生産の効率化や知能化を実現しようとしています。
例えば、外観検査工程では、製品検査の結果データをリアルタイムに近いスピードで蓄積し、多変量解析を行うことによって、生産ラインのクセを把握し、故障や不良品の発生を予測することが考えられます。
また、組み立て工程では、熟練の作業員の視線や手の動きのデータを画像センサで収集し、人工知能を用いてビッグデータ解析することで、最も体への負担が少なく、効率的な作業を見出すこともできそうです。
さらに、海外の鉱山などでは、採掘の最適化を目的としてビッグデータ解析が使用されています。
海外の鉱山では多くの場合、採掘範囲が広範囲に及ぶため、採掘現場から鉱石を運ぶ際に何台ものトラックが使用されますが、このトラックの運行の最適化、つまり「空荷を減らし、最短距離を走行するルートを見つける」ことに、ビッグデータ解析が威力を発揮しているのです。
これからの製造業にはビッグデータ解析が必要です。
以上、ビッグデータ解析についてご紹介しました。
ビッグデータ解析は理論が難解なこともあり、思ったよりも普及していないようにもみえます。
また、日本の製造業では「現場主義」の傾向が強いために、机上の空論のように捉えられているのかもしれません。データサイエンティストの不足もそれに拍車をかけています。
しかし、製造業では人材不足が深刻になりつつあります。生産の知能化を実現し、製品に対する要求品質の高度化に対応するためには、ビッグデータ解析を生産の現場に普及させることが望まれているのです。
(アイアール技術者教育研究所 F・S)
≪引用文献、参考文献≫
- 1)「図解まるわかり データサイエンスのしくみ」増井敏克著 翔泳社
- 2)NECソリューションイノベータ(株)WEBサイト
https://www.nec-solutioninnovators.co.jp/sp/contents/column/20220318_big-data.html - 3)日本電気(株)WEBサイト
https://jpn.nec.com/solution/dotdata/tips/bigdata-analytics/index.html