課題に適したAIシステムを構築する

コース: AI 入門

課題に適したAIシステムを構築する

“

AI システムを構築するプロセスを、犬を識別する問題で振り返ってみましょう。最初にすべきことは、データで何がしたいのかを明確にすることです。この例なら、データを AI システムが独自にグループ分けするクラスタリングではなく、犬が写っている画像と、犬が写っていない画像という、２つのカテゴリーにデータを分類する AI システムを作りたいということです。この例などは、典型的な２項分類問題です。 AI システムにとって選択肢が２つしかない分類問題には、機械学習の教師あり学習を使います。教師あり学習の訓練データには、ラベリングが必要です。確認されている犬の画像をシステムにふんだんに学習させるためです。もう１つ考えなければならないのは、このシステムに通常の機械学習アルゴリズムと人工ニューラルネットワークのどちらを使うかということです。ここで見ている例は分類問題なので、通常の機械学習アルゴリズムにするなら、 k 近傍法かナイーブベイズを選ぶのが一般的でしょう。ただしこの例では、画像に含まれるピクセルを１つずつ分解してデータにするためおびただしい量のデータを複雑に処理する必要があります。それを考慮して、ここでは人工ニューラルネットワークを使うことにします。人工ニューラルネットワークには、入力層、隠れ層、出力層があります。この例は２項分類なので、犬、または、犬ではない、という２種類の答えしかありません。ですから、必要となる出力層のノードも２つだけです。用意したニューラルネットワークは、まず初期化します。システムは、すべての伝達路の重みをランダムに決定し、すべてのノードのバイアスをゼロに設定します。おもちゃのお絵描きボードを、まっ白に戻すイメージです。この状態から、訓練データをネットワークに読ませていきます。最初のうちは、でたらめな推測とほとんど変わらない結果になるでしょう。 62％の確率で犬、とか、 55％の確率で犬ではない、といった推測をネットワークが出していき、それぞれの推測を、訓練データのラベルと照合します。誤った判定になった場合、ネットワークは勾配降下法を使って、重みづけとバイアスに必要な調整の大きさを計算します。このようにして、すべての訓練データを使った細かい調整を重ねます。すでに解説したように、誤りの程度に応じてネットワークの重みづけとバイアスを調整する過程を誤差逆伝播法といいます。これは、ネットワークを遡って設定のダイヤルを調整していくようなプロセスです。こうして、訓練データを使った学習が完了した人工ニューラルネットワークには、テストデータを使った検証を行います。テストデータには、ラベリングしていない多種多様な画像を使って、そこから犬の画像をどれだけ正確に識別できるか確認します。訓練データで高まった精度がかなり低下するという場合は、過学習の状態になっていることが考えられます。過学習とは、数が少ない訓練データの識別に特化してモデルが複雑になりすぎていて、多様なテストデータに対応できない状態です。皆さんの仕事で、犬の画像を識別する必要性はなくても、ここで見てきた２項分類のシステムは、さまざまな応用が可能で効果的な手法です。顧客データ、営業データ、 IoT データを使った２項分類の活用法を、いろいろ考えてみましょう。

課題に適したAIシステムを構築する

コース: AI 入門

課題に適したAIシステムを構築する

コースをダウンロードして学習しましょう。

目次

ビジネストピックを検索

クリエイティブトピックを検索

テクノロジートピックを検索