教師あり学習、教師なし学習、そして自己教師あり学習《AI用語解説》
昨今、ChatGPTを始めとする生成系AIが大きな話題となり、AI(人工知能)に関する話題を日々耳にするようになりました。
そこで今回は、AIに深く関わる機械学習(学習済みモデル)について、用語を解説していきます。
1.機械学習(学習済みモデル)の種類・分類
「機械学習」とは、機械(コンピュータ)が大量のデータを学習することにより、汎用的なルールやパターンを自ら導き出し、導き出したルールに従い予測や判断を実現する技術です。
機械学習の学習方法(学習済みモデル)は大きく分けると「教師あり学習」、「教師なし学習」、さらに「強化学習」の3種類に分類されますが、「教師あり学習」と「教師なし学習」を組み合わせた「半教師あり学習」「自己教師あり学習」と呼ばれる学習方法も存在します。
(1)教師あり学習
「教師あり学習」では、正解を判断する為の基準となるデータ(情報)とそのデータが持つ特徴を紐づけた学習データを用いて、AIが正解値とその特徴の間の関係性/パターンを見出し、入力データが「正解=教師となるデータ」に近似している場合に「正解」と判定を下す学習済みモデルを作成します。
「教師あり学習」を使用した学習済みモデルは、大きく「分類モデル」と「回帰モデル」の二つに分けることができます。
「分類モデル」は、データの所属するカテゴリを振り分けるための学習済みモデルです。
例としては、犬の画像とその他の画像を分ける場合、犬の画像データに「犬」というラベルを付けておき、画像データの中から犬を形成する要素、特徴を読み取らせることにより、犬の画像パターンを学習する画像認識の学習済みモデルや、異常検出向けの学習済みモデルがあげられます。
「回帰モデル」は、連続する値を予測するための学習済みモデルです。
例としては、過去の実績から将来の売上や株価を予測する学習済みモデルや、気象予測の学習済みモデルがあげられます。
(2)教師なし学習
「教師なし学習」においては、教師となるデータに「ラベル」がついておらず、データの「特徴」のみを利用して、予測や判定対象となる「正解がない」状態からAIが自ら反復学習を行い、共通パターンを学習していきます。
「教師なし学習」を使用した学習済みモデルとしては、主に「クラスタリング」と「次元削減」の二つがあげられます。
「クラスタリング」は、データ間の類似度によって、データをいくつかのグループ(クラスタ)に振り分ける学習済みモデルで、例としてはEC(Electric Commerce)のデータに適用し、「どんな顧客層があるのか」を認識することを目的とした顧客セグメンテーションを行う学習済みモデルがあげられます。
「次元削減」は、重要な情報を際立たせるために、データを低次元に圧縮することで、膨大なデータをコンパクトにまとめて表現する統計的分析向けの学習済みモデルで、例としては、アンケート結果をいくつかの共通点で分類する主成分分析の学習済みモデルがあげられます。
(3)強化学習
「強化学習」では、データモデルを活用せずに、AI自身が与えられた環境下で試行を繰り返して、最適な解、方法を探って学習済みモデルを構築していきます。
「強化学習」の学習済みモデルは囲碁AIや将棋AIなどゲームの世界で活用されてきましたが、自動運転、ロボット制御など様々な分野で応用することが可能です。
(4)半教師あり学習
「半教師あり学習」は、「教師あり学習」と「教師なし学習」を組み合わせた手法で、学習用のデータとして、正解ラベルがついているデータとついていないデータの両方を使い、正解ラベルがついていないデータに対しては正解ラベルがついているデータからラベルを事前予測して付与し、全体の学習済みモデルを構築します。
「半教師あり学習」は、モデル学習のためのデータを取得したり、正解ラベルをつけるコストを低減することを目的としていますが、「教師あり学習」に比べて学習済みモデルの精度は下がります。
(5)自己教師あり学習
「自己教師あり学習」は、ラベルの付いた教師データを用意することができない場合に、「教師なし学習」と同様にデータの特徴や構造を解析し、データを分類し、ラベルの予測を行うことで間接的に教師データを生成し、モデルの学習を進めます。例としては「大規模言語モデル」における利用があげられます。
2.大規模言語モデル
ユーザーのリクエストに応じてテキスト文章を生成する生成系AIにおいては、大規模なテキストデータを人がラベル付けを行わずに学習する「自己教師あり学習」を活用した大規模な「言語モデル」が利用されています。
「言語モデル」の事前学習では、大量の文章から一部の単語を見えなくして、その単語が何なのか予測することで単語の表現を学習する事前学習済み言語モデルを構築し、事前学習済み言語モデルを文章分類や質疑応答といった用途に応じてファインチューニングすることで、個別の用途に特化し、かつ高い精度のモデルに学習することができます。
(日本アイアール株式会社 特許調査部 M・K)