研究内容

確率分布の高精度推定

研究内容 > パターン認識 > 確率分布の高精度推定


パターン認識では学習用のデータから各クラスのデータが持つ規則を学習します。パターン認識の統計的アプローチでは、各クラスのデータがそれぞれ何 らかの確率分布に従って生成されたと仮定します。この「何らかの確率分布」を真 の分布と呼びます。真の分布はクラス毎の特徴をよく表していると考えられますので、真の分布を正しく推定することが高精度なパターン認識の 実現につながります。

真の分布を正しく推定するためには多量のデータが必要です。しかし、一般にデータの収集には手間がかかるので、少量のデータしか使用できません。も し少ないデータで分布を推定すると、推定された分布に誤差が 生じ、真の分布とは異なる分布が推定されます。この分布を用いて認識を行っても高精度なパターン認識を実現することができません。この問題はパターン認識 研究が始まって間もない頃から今に至るまで研究され続けている基本的な問題です。

大町研究室では、誤差を含んだ分布を統計理論を用いて補正し、真の分布に近づける手法を検討しています。誤差を補正するとき、誤差を分布の大きさの誤差分布の方向の誤差の二種類に分けて考えます。これまでの手法では大 きさの補正しか行っていませんでしたが、方向の補正も行うことで高い精度で分布を推定することが可能にな り、認識精度を向上させることに成功しました。

手法の説明

関連文献