コース: AI 入門

データをクラスタリングする

コース: AI 入門

データをクラスタリングする

分類は万能ではなく、 そもそも、ラベリングした訓練データが 十分集まらないこともあります。 このような場合には、システム自体に データをクラスタリングさせる方法も 考えられます。 クラスタリングとは、教師なし学習によって AI が独自にデータを グループ分けすることを指します。 ネットショップでは、 「合わせて購入されている商品」が 表示されます。 コンピューターのマウスを買うと、 キーボードも一緒に薦められたという 経験がある人は多いでしょう。 顧客に必要なものを案内し、 会社の売上も増やしてくれる、 とても効果的な機能です。 そこでは教師なし学習システムを使って 顧客の購入履歴に基づくクラスタリングを 行っています。 分類との最大の違いは、あらかじめ人が 決めたカテゴリーに分けるのではなく、 AI がグループ分けをしている点です。 大まかに言えば、 教師あり学習でできるのが分類、 教師なし学習でできるのが クラスタリングということです。 私の息子は、 毎年ハロウィンの日に仮装をして 近所の家々を回り、 お菓子をもらってきます。 さまざまなお菓子が、 用意した袋いっぱいに集まります。 息子はまず、そのお菓子を 好きな種類に分類していきます。 当初は私の経験が息子の 役に立っていました。 機械学習の教師のように チョコ、ピーナッツバター、ミント、 グミ、など、カテゴリーを 考えるのを手伝ってあげると、 初めて見るお菓子も息子が 自分で考えて分類していました。 これは、機械がする 教師あり学習と同じです。 さて、息子は外国に祖父母がいて、 ハロウィンを共に祝いたいようで、 毎年現地で買い集めた お菓子を送ってくれます。 この分にはラベルがないので、 教師あり学習ができません。 見たことがないお菓子で、 包装の文字も読めないからです。 ですから、 教師なし学習をすることになります。 息子の目で、自分流に分けます。 分ける基準は、息子なりのデータ観察です。 大きさや色といった基準で分けていくのが 普通なのでしょうが、 意外なクラスターも作られました。 バラやオレンジの花を使ったものだけを 集めて、香水のお菓子と名付けたのです。 教師なし学習では、 このように、機械が独自にデータを検討して 独自の結果を導き出します。 クラスタリングの利点は、 大量に存在するラベリングされていない データの特性が生かせることです。 世の中には、私が見たこともない お菓子があふれています。 そのようなお菓子を適切に 分類するカテゴリーは、 私には作り出せません。 クラスタリングの可能性は、 これだけにとどまりません。 1例は顧客のクラスタリングです。 アルゴリズムが作り出した クラスターを調べても 一見ぴんとこないかもしれません。 ただ、Amazon、Netflix、Twitter などの 大手企業が 顧客の行動履歴や関係性などの データクラスターを効果的に活用して 成果を上げていることも、 ぜひ覚えておいてください。 AI は、人が気づきにくいパターンも 見つけ出せるのです。

目次