研究内容

パターン認識

研究内容 > パターン認識

パターン認識とは?

 パターン認識とは、観測されたパター ンをあらかじめ定められた概念(クラス)の1 つに対応させる処理のことです。例えば数字を認識するのであれば、与えられ た画像(パターン)を0から9までのいずれかに対応させる処理になります。 この、人間にとっては易しい処理も機械(コンピュータ)には非常に難しく、 間違いのない認識を実現するために様々な研究がされています。

 コンピュータによるパターン認識は、通常特徴抽出 識別の2つの過程で行われます。
特徴抽出とは、対象を区別できるような情報を観測パターンから取り出す処理で す。コンピュータで扱いやすいように、情報はすべて数値化されます。取り出 された情報を特徴と呼びます。花の種類を認識 するなら、花弁の色・数・形などが特徴になります。どのような特徴を抽出す るかはパターン認識の性能を決める重要な要素ですが、何が有効な特徴となり 得るかは認識しようとする対象によって異なり、設計者の経験と勘によるとこ ろが大きいのが事実です。
識別は、得られた特徴を用いて観測されたパターンがどのクラスに属するかを 判断する処理です。観測パターンから得られた数値を対象とするので、識別の 理論は様々な認識対象に対して適用できます。

識別理論

 識別の手法は、大きく統計的アプローチ構文解析 的アプローチに分類されます。

 統計的アプローチでは、認識対象となるそれぞれのクラスについて、あらか じめ多数のデータを収集しておきます。そして、収集されたデータから得られ た統計量(平均、分散など)をもとに、観測パターンが各クラスに属するもっともらしさを評価します。たとえば、数字の幅と 高さを特徴にしたとします。「3」と「1」の画像を大量に収集し、それらの 画像の幅と高さを求めておきます。例えば右図で、は様々な「1」の幅と高さを2次元平面上にプロットしたもの、は「3」を同様にプロットしたものです。「1」か 「3」か分からない数字を観測したとき、その幅と高さがのようになったとして、これは「1」と「3」のど ちらでしょうか。一概には言えませんが、おそらく「3」と判断するのが適当 だろうと考えられます。なぜなら、既知の多くの「3」の特徴が近くに分布し ているからです。
もちろん0から9までの数字がこのような単純な特徴だけで認識できないのは明 らかです。一般に現実の認識問題の特徴は抽出も複雑で数も多く(高次元)、ど のクラスに属するかを判断するのは難しい問題になります。
様々な特徴に対応できる一般的な方法として、確率分布 を考える方法があります。クラスごとに多くのデータを収集して特徴を 求め、特徴の確率分布を求めておきます。未知の観測パターンから特徴を求め、 それが各クラスに属する確率を計算します。最も確率の高いクラスが一番もっ ともらしいクラスであると判断する方法です。

 一方、構文解析的アプローチでは、各クラスのパターンがある規則(文法)に従って生成すると考え、観測パターン を生成するのはどのクラスの規則であるかを判断することでクラスを判定しま す。例えば「3」であれば、「曲線+鋭角+曲線」、「5」であれば「横線+ 直角+縦線+鋭角+曲線」という規則が考えられます。これらのうち未知の観 測パターンを生成することのできる規則を判定することで「3」か「5」かを 判定します。

研究テーマ

 大町研究室パターン認識研究グループでは、機械による高精度なパターンの 認識・理解を目指し、理論から応用まで幅広い研究を行っています。以下は最 近の主な研究テーマと成果です。

識別理論

 特徴抽出により得られた特徴をもとに、いかに高精度に識別を行うかはパター ン認識における中心テーマの一つです。様々な認識対象に適用できる万能な認 識手法を探求しています。特に統計的アプローチにおける識別の高精度化・高 速化の研究を行っています。

パターン認識の応用

 パターン認識の理論を実際のシステムに応用します。高精度な汎用システム を目指して研究を進めています。


 machi @ aso.ecei.tohoku.ac.jp