機械学習の全体図

はじめに

近年よく耳にする機械学習(machine learning)。AIやディープラーニングなどの単語はよく耳にされると思う。しかしその厳密な意味や違いはぼんやりとされがち。そこで機械学習の全体像を捉えてみよう!

機械学習とは

機械学習はデータの意味を理解するための
アルゴリズムの応用とその科学である

これを機械学習とは?に対する答えの1つと我々は考える。

ではそのアルゴリズムとはいかなるものか、という新たな質問が出てくる。そこで機械学習を大きく分類してみる。

機械学習は3種類に分けられる!?

ぼんやりとしたイメージを持たれがちな機械学習、実は以下の3つに分類することができる

機械学習

  1. 教師あり学習
  2. 教師なし学習
  3. 強化学習

巷で話題のニューラルネットワークディープラーニングも、分類手法で有名なサポートベクターマシンk-平均法も、具体的な例ではSiriなどの音声認識技術AlphaGoなどのコンピュータ囲碁プログラムも、すべてこの中の手法の1つであるのだ!

機械学習のアルゴリズムは上記3つで分類できる。

そこで我々が理解する必要があるのは、

3種類の機械学習の違いを認識し、解きたい問題に対し適切なアルゴリズムを見極めること!

教師あり学習

教師あり学習とは、

答えがラベル付けされたトレーニングデータからモデルを予測→未知の将来データを予測

というもの。

この予測とは具体的には何か?

分類回帰である。

分類は
このデータはクラスA、これはクラスB、というように結果が離散値で得られる。

一方、回帰は
Aの場合は104.54円、Bの場合は104.67円というように結果は連続値で得られる。

作成したモデルに対して答えがわかっているトレーニングデータ(教師データ)を使ってすぐにモデルの修正ができる利点がある。ただ、答えがわかっているデータを集めないといけないのは言うまでもない。

教師あり学習

  • 答え(教師)がラベル付けされたデータ
  • 学習に対するフィードバックが可能
  • 分類予測と回帰予測

教師なし学習

教師なし学習の最大の特徴は学習時に答え(=教師、トレーニングデータ)を必要としない点である。

つまり、構造がよくわかっていないデータから構造を見いだしてくれる。見えないデータを見えるように分類するのだ。

ただ、答えがわかっていないため、得られたものが妥当かどうかをフィードバックすることはできず、人間がチェックする必要がある。

教師なし学習

  • 構造が不明データ
  • 学習に対するフィードバック無し
  • データから隠れた意味・構造を見出す

強化学習

強化学習で重要な概念は、エージェント環境そして報酬である。

エージェントは行動や戦略を決定するもの。エージェントに含まれないその他すべてを環境と言う。エージェントの行動に環境がリアクションする。このリアクションが報酬である。

エージェントは得られた報酬を最大化するようまた新たな行動を学習していく。

強化学習は文字通り、自身の行動を強化していくという学習なのである。

強化学習

  • 最適な戦略・行動の決定プロセス
  • 戦略・行動に対する報酬を得る
  • 分類や回帰ではなく一連のプロセス

まとめ

ここでは機械学習の全体像を掴むために教師あり学習教師なし学習強化学習の3つに分類してそれぞれの特徴をまとめた。

個々のアルゴリズムを学習する時はどのタイプかを意識しましょう!