機械学習やAI、ディープラーニングがすごいってのはわかっていても具体的にそれでどう生活が変わっていくのかプロダクトが変わっていくのか個人的な予想をまとめてみた。

機械学習でできること

  • クラス分類
  • 推薦(リコメンド)
  • 回帰による未来予測
  • 次元削減

具体的にどう活かせるのか?

すでにサービスに生かされている分野でいうと

  • コンテンツのリコメンド
  • 広告で最適なクリエイティブを出すためのアルゴリズム
  • 音声や画像などの認識

コンテンツのリコメンドは評価とエンタメを変える

コンテンツのリコメンドを機械学習で行うはかなり今までのサービスの設計を変えます。今までリコメンドは主に人からの評価を用いていました。ということは人が集まっていないサービスはそのコンテンツを評価し、人にすすめることができませんでした。また人の評価が貯まるまで時間ラグがあるためすぐに評価し、推薦することができませんでした。しかし、機械学習により一度モデルを作成したらもうそれを待たずに人に進めることができます。もちろんそのモデルを作るぐらいには人を集める必要がありますが、従来よりかなり少ないコストですみます。

これにより大きく変わるのはエンタメ系です。エンタメコンテンツはユーザーのニーズが顕在化していないため検索よりもリコメンドが主になります。今まではユーザー数がかなりいてその評価をもとにしたランキングなどが重要でしたが機械学習によりパーソナライズ化されたリコメンドを瞬時にできるようになります。

テキストコンテンツ以外の検索、分類、情報付与

今まで情報技術はテキストを中心に発展してきました。理由としては画像データは正規化しにくいからです。ただ機械学習により画像なども認識し、分類できるようになりました。今までは画像や音声は分類がしにくいジャンルでテキストより難易度が高かったですが今後はそのへんももっと増えていくと思います。

世界はこうなっていきそう

モデルは公開されるか否か?

機械学習はモデルを作るところが重要ですがこのモデルは公開されるのか?どう機械学習周りの業界は進んでいくのか考えてみましたがまだまとまってません。(逆に誰か意見くれ)モデル自体は競争優位性の源なので公開されることはないですが、apiなどで利用は公開されると思います。なぜならより使ってもらい、データが溜まったほうがモデルの精度が上がるからです。実際googleはその形で公開しています。今後機械学習はapiで利用できるようになり、それを使えば使うほどapi提供者のモデルの精度があがります。今まで以上に一極集中型になると思います。

データを持つところが強いがそれはデータの多さではない

ただデータを大量に持つところのみが強いというわけではなく、クリティカルなデータを持っているところが強くなります。機械学習はデータの量より正確性や教師があるかないかのほうが精度に影響与えるという研究があったり逆に量が多すぎるとそのパターンのみに特化しすぎる状態、過学習になるという研究もあるので大量に持っているかではなく、良質なデータを集められるかが鍵になります。