確率分布の高精度推定
パターン認識では学習用のデータから各クラスのデータが持つ規則を学習します。パターン認識の統計的アプローチでは、各クラスのデータがそれぞれ何
らかの確率分布に従って生成されたと仮定します。この「何らかの確率分布」を真
の分布と呼びます。真の分布はクラス毎の特徴をよく表していると考えられますので、真の分布を正しく推定することが高精度なパターン認識の
実現につながります。
真の分布を正しく推定するためには多量のデータが必要です。しかし、一般にデータの収集には手間がかかるので、少量のデータしか使用できません。も
し少ないデータで分布を推定すると、推定された分布に誤差が
生じ、真の分布とは異なる分布が推定されます。この分布を用いて認識を行っても高精度なパターン認識を実現することができません。この問題はパターン認識
研究が始まって間もない頃から今に至るまで研究され続けている基本的な問題です。
大町研究室では、誤差を含んだ分布を統計理論を用いて補正し、真の分布に近づける手法を検討しています。誤差を補正するとき、誤差を分布の大きさの誤差と分布の方向の誤差の二種類に分けて考えます。これまでの手法では大
きさの補正しか行っていませんでしたが、方向の補正も行うことで高い精度で分布を推定することが可能にな
り、認識精度を向上させることに成功しました。
関連文献
- 標本共分散行列の固有ベクトルを用いた真のマハラノビス距離の推定法
電子情報通信学会論文誌D-II, vol.J86-D-II, no.1, pp.22-31, January 2003
岩村 雅一, 大町 真一郎, 阿曽 弘具
- A Method to Estimate the True Mahalanobis Distance from
Eigenvectors of Sample Covariance Matrix
Lecture Notes in Computer Science (Joint IAPR International
Workshops
SSPR 2002 and SPR 2002), vol.2396, pp.498-507 August 2002
Masakazu Iwamura, Shinichiro Omachi, and Hirotomo Aso
- A Modification of Eigenvalues to Compensate Estimation
Errors of Eigenvectors
Proceedings 15th International Conference on Pattern
Recognition
(ICPR2000), vol.2, pp.378-381, September 2000
Masakazu Iwamura, Shinichiro Omachi, and Hirotomo Aso
- 固有ベクトルのずれの影響を軽減する固有値補正法
電子情報通信学会技術研究報告, PRMU99-146, November 1999
岩村 雅一, 大町 真一郎, 阿曽 弘具