パターン認識


パターン認識とは?

パターン認識とは、観測されたパターンをあらかじめ定められた概念(クラス)の1つに対応させる処理のことです。例えば数字を認識するのであれば、与えられた画像(パターン)を0から9までのいずれかに対応させる処理になります。この、人間にとっては易しい処理も機械(コンピュータ)には非常に難しく、間違いのない認識を実現するために様々な研究がされています。

コンピュータによるパターン認識は、通常特徴抽出識別の2つの過程で行われます。
特徴抽出とは、対象を区別できるような情報を観測パターンから取り出す処理です。コンピュータで扱いやすいように、情報はすべて数値化されます。取り出された情報を特徴と呼びます。花の種類を認識するなら、花弁の色・数・形などが特徴になります。どのような特徴を抽出するかはパターン認識の性能を決める重要な要素ですが、何が有効な特徴となり得るかは認識しようとする対象によって異なり、設計者の経験と勘によるところが大きいのが事実です。
識別は、得られた特徴を用いて観測されたパターンがどのクラスに属するかを判断する処理です。観測パターンから得られた数値を対象とするので、識別の理論は様々な認識対象に対して適用できます。

識別理論

識別の手法は、大きく統計的アプローチ構文解析的アプローチに分類されます。

統計的アプローチでは、認識対象となるそれぞれのクラスについて、あらかじめ多数のデータを収集しておきます。そして、収集されたデータから得られた統計量(平均、分散など)をもとに、観測パターンが各クラスに属するもっともらしさを評価します。たとえば、数字の幅と高さを特徴にしたとします。「3」と「1」の画像を大量に収集し、それらの画像の幅と高さを求めておきます。例えば右図で、は様々な「1」の幅と高さを2次元平面上にプロットしたもの、は「3」を同様にプロットしたものです。「1」か「3」か分からない数字を観測したとき、その幅と高さがのようになったとして、これは「1」と「3」のどちらでしょうか。一概には言えませんが、おそらく「3」と判断するのが適当だろうと考えられます。なぜなら、既知の多くの「3」の特徴が近くに分布しているからです。
もちろん0から9までの数字がこのような単純な特徴だけで認識できないのは明らかです。一般に現実の認識問題の特徴は抽出も複雑で数も多く(高次元)、どのクラスに属するかを判断するのは難しい問題になります。
様々な特徴に対応できる一般的な方法として、確率分布を考える方法があります。クラスごとに多くのデータを収集して特徴を求め、特徴の確率分布を求めておきます。未知の観測パターンから特徴を求め、それが各クラスに属する確率を計算します。最も確率の高いクラスが一番もっともらしいクラスであると判断する方法です。

一方、構文解析的アプローチでは、各クラスのパターンがある規則(文法)に従って生成すると考え、観測パターンを生成するのはどのクラスの規則であるかを判断することでクラスを判定します。例えば「3」であれば、「曲線+鋭角+曲線」、「5」であれば「横線+直角+縦線+鋭角+曲線」という規則が考えられます。これらのうち未知の観測パターンを生成することのできる規則を判定することで「3」か「5」かを判定します。

研究テーマ

機械による高精度なパターンの認識・理解を目指し、理論から応用まで幅広い研究を行っています。以下は最近の主な研究テーマと成果です。

識別理論

特徴抽出により得られた特徴をもとに、いかに高精度に識別を行うかはパターン認識における中心テーマの一つです。様々な認識対象に適用できる万能な認識手法を探求しています。特に統計的アプローチにおける識別の高精度化・高速化の研究を行っています。

パターン認識の応用

パターン認識の理論を実際のシステムに応用します。高精度な汎用システムを目指して研究を進めています。


machi@aso.ecei.tohoku.ac.jp