コース: プロンプトエンジニアリング基本講座

生成AIとは - ChatGPTのチュートリアル

コース: プロンプトエンジニアリング基本講座

生成AIとは

皆さんは、ChatGPT を ご存知でしょうか。 ChatGPT モデルの最新モデルである GPT 3.5 がリリースされてから、 1年も経ちませんが、 使用されているユーザーは、 1億人を超えました。 実際に、業務で活用されている方も いらっしゃるとは思いますが、 ChatGPT そのものの仕組みを、 理解している方は少ないと思います。 そこで、このレッスンでは、 ChatGPT の仕組み、 ChatGPT 含む生成 AI の 仕組みについて、 解説していきます。 まず、ChatGPT や生成 AI の モデルとなっている 人工知能について、 説明していきます。 生成 AI の多くは、LLM という 人工知能を使用しています。 LLM とは、 大規模言語モデルと呼ばれていて、 世界中のテキストのデータや 画像のデータ、 動画のデータなどを学習しています。 今回は、簡単に 図を用いて説明していきます。 左画面にあります、 ネコの画像と「猫」というラベル、 イヌの画像と「犬」という ラベルがあります。 それぞれ、猫の画像には 「猫」というラベルが付いており、 犬の画像には 「犬」というラベルが付いております。 簡単に言えば、名札にはなりますが、 それぞれ猫の画像と猫、 犬の画像と犬、というものを 人工知能に学習させます。 人工知能は、学習した中でも、 猫の特徴や犬の画像を学習をします。 そこで、新しく人間が 猫の画像を用いて、 「この画像はどちらですか?」 というふうに質問をすると、 過去学習した画像のデータの特徴から 人工知能は猫ですという判断をします。 今回は簡単に、 画像のデータを説明しましたが、 テキストのデータや動画のデータも 人工知能を学習していて、 こういったところから さまざまな生成 AI が誕生しました。 次は、生成 AI の中でも ChatGPT の仕組みについて、 より詳しく説明していきます。 生成 AI とは、 ジェネレーティブ AI とも呼ばれていて 何かを生成する AI になっています。 今回説明する ChatGPT でいうと、 テキストを生成する AI になっています。 なぜ、生成という言葉が 使われているかを今から説明していきます。 先ほどの人工知能の仕組みを 改めて説明しますと、 ChatGPT で言いますと、 インターネット上にある さまざまな膨大な量のテキストのデータを 学習しています。 そこで学習したデータから、 新しく「吾輩」という言葉の次に、 一番続く確率が高い単語を生成します。 今回で言うと、 「は」という文字が一番確率が高いので、 「は」を出力しています。 こういった形で、 連続して生成をしているので、 「吾輩は」の次は「猫」 その次は「で」、 その次は「ある」という形で、 最終的には「吾輩は猫である」 といった形で生成をしています。 こういった形で、 過去学習したデータの中から、 次に続きやすい単語というものを 生成をしている、作っているので、 生成 AI と呼ばれています。 ひとつ、注意点にはなりますが、 一番確率の高い文字を 連結させているだけなので、 ChatGPT や生成 AI が 本来の文脈の意味を 理解しているわけではない、 ということに注意してください。 こちらは、このコースの 終盤のレッスンで説明もしますが、 生成 AI が嘘をついてしまう というところにも、 関係しています。 今回は、ChatGPT と生成 AI、 その大元となっている 人工知能の仕組みについて、 解説しました。 簡単に言うと、過去の膨大な量のデータ というものを学習し、 新しく入力された文字、 画像、動画に対して、 一番続く可能性の近い単語を生成している というところが、 仕組みになっております。 次のレッスンでは、 具体的に ChatGPT や 生成 AI にまつわる、 便利なツールを説明していきます。

目次