はじめに

コンピュータで学習することについて、代表的な手法について以下にまとめます。

種類

  1. 機械学習
  2. 深層学習
  3. 強化学習
  4. 転移学習

機械学習

大量のデータを入力することで、データ間の相関関係を計算し、目的に合わせて結果を出力します。
出力される結果の種類としては、以下のものがあります。

識別

入力されたデータが何であるかを出力するものです。

[例1]
 身長、体重、髪の長さ、服装の種類などから男性か女性かを出力する。
[例2]
 年齢、職業、年収、家族構成などから家を購入するか否かを予測する。

回帰(数値予測)

入力されたデータとその時の値をあわせて学習し、新しい条件に対応する数値を出力するものです。

[例1]
 年月日、気温、天候などから地域の電気使用量を予測する。
[例2]
 降水量から川の水位を予測する。

分類(クラスタリング)

あるデータ群を無作為ではなく、一定の条件を抽出して指定した数の群に分けるものです。

[例]
 学習塾において、各教科の成績から生徒を3つのクラスに分類する。

おもな学習アルゴリズムとして、代表的なものは以下のとおりです。

識別・回帰

  • サポートベクトルマシン(SVM)
  • ランダムフォレスト
  • ニューラルネットワーク

識別

K近傍法

分類

K平均法

深層学習

機械学習の前段で、データに幾重ものフィルターをかけるなどの加工を施すことにより、入力データの特徴を強めてから機械学習にデータを入力し、学習するものです。
また、機械学習の部分ではニューラルネットワークが使用されることが多くなっています。

[例]
 画像に写っている物体を識別する。

強化学習

ある行動に対し、良い条件と悪い条件を設定し、乱数を使って試行させながら、良い条件に合致した行動の優先度を高め、悪い条件に合致した行動の優先度を下げながら、パラメータを調整する手法です。

[例]
 ゲームをクリアする。ゲームで高得点をとる。

転移学習

あるデータで学習させたモデルを、別のデータに適応させる技術です。新しいデータを大量に集めることが難しい場合などに、全く異なるデータを学習済みモデルに入力し、その予測結果を新しい学習データとして使用します。

[例]
 少ない画像データでそれなりの精度で識別する。

最後に

これらの技術は人工知能における要素技術として応用され、複数のモデルや条件を組み合わせることにより人と同じような判断をする研究が日々行われています。

また、新しい技術も日進月歩で開発されていることから、今後より多くのデータとともに有益な結果を得られる技術として発展するものと考えられます。

(専門研究員 木村忍)