コース: Microsoft Azure AI Fundamentals(AI-900)試験対策:Computer Vision

今すぐコースを受講しましょう

今すぐ登録して、23,200件以上登録されている、業界エキスパート指導のコースを受講しましょう。

画像処理の用途

画像処理の用途

前のレッスンでは、 画像データの学習は難しいとはいえ、 大量のデータがあれば 特徴を見つけ出せる、 ということがわかりました。 このレッスンは、観点を変えて、 画像データが学習できたとして、 それでは、画像処理では何ができるか、 どんな機能があるのかを見てみます。 画像処理の用途を見てみましょう。 ここでは、3つ挙げてみます。 1つ目が、コンテンツの整理です。 2つ目は、テキスト抽出。 そして3つ目は、 物体検出・空間分析です。 ここで、物体検出・空間分析という 2つの機能のように思えますが、 これは、二次元のデータか、 空間的な広がりに意味があるデータか という対象の違いであって、 どちらも、画像内の物体を見つけ出す、 という用途です。 それぞれの用途の意味は、 次のとおりです。 コンテンツの整理とは、 それは何の画像か、 また、画像から得られる情報は何か、 という意味です。 テキスト抽出とは、 移っている文字は何か、 また、その文字は何を意味するか、 ということです。 物体検出・空間分析は、 その画像には、何が写っているか、 また、オブジェクトの動きから 何か情報が得られるか、 という意味です。 続いて、この3つの用途について、 機能面から考察しましょう。 コンテンツの整理は、 画像分類、タグ付け、画像の説明、 顔の検出といった機能例が挙げられます。 テキスト抽出は、 光学式文字認識です。 物体検出・空間分析は、 物体の位置情報、 また、動画内の人の存在と 動きの検出といった機能が 挙げられます。 続いて、各機能について、 もう少し見ていきましょう。 まずは、コンテンツの整理に 含まれる機能を見ていきます。 コンテンツの整理について、 4つの機能を挙げました。 1つ目の画像分類とは、 「何の画像か?」で分類する ということです。 タグ付けとは、 「何が写っているか?」を 情報抽出するということです。 3つ目の画像の説明とは、 画像に対して、 タイトルや短い説明文を 生成するということです。 そして4つ目の顔の検出とは、 人間の顔の位置を検出して、 年齢などを予測するというものです。 このように、「分類」 「抽出」「生成」「検出」のように、 機能に差があるように思えますが、 すべてコンテンツの整理のための機能だ、 と言えます。 続いて、テキスト抽出について…

目次