Japanese / English

文献の詳細

言語 日本語
著者 大町 真一郎, 孫 方, 阿曽 弘具
論文名 カテゴリー間分布を考慮した文字認識用マルチテンプレート辞書の構成法
論文誌名 電子情報通信学会論文誌D-II
Vol. J79-D-II
No. 9
ページ pp.1525-1533
年月 1996年9月
要約 文字認識において辞書のマルチテンプレート化は認識の高精度化の一つの 手段であるが,辞書が大きくなり記憶容量・計算時間が増加する. また,同一字種のテンプレートを複数持つことは異なる字種のテンプレート間の 距離が近くなることを意味し,逆に誤認識となる字種も現れる等の問題がある. 本論文では,これらの問題を解決するための,文字特徴量の分布形状を 考慮した辞書作成法について検討する. まず統計的な手法を用いて空間上での文字特徴量の分布状況を調べる. そして,同一字種のサンプルパターンの分布(カテゴリー内分布)と異なる字種の サンプルパターン間の分布(カテゴリー間分布)を考慮することで 誤認識が生じ得る状況を推定し,誤認識の可能性のある字種のテンプレート数を 増やす操作を繰り返すことで字種ごとにテンプレート数の 異なる辞書を人が介在せずに作成する手法(字種適応クラスタリング法)を提案する. 本手法により,JIS 第一水準の漢字を含む印刷文字を用いた認識実験において, 同程度の認識率を得るために必要な辞書のテンプレート数を 従来法の 40% 程度に減少させることができることを示す.
一覧に戻る