Japanese / English

文献の詳細

言語 日本語
著者 森 大毅
論文名 知識に依存しない言語モデルに関する研究
年月 1998年3月
要約 本論文では、文字認識や連続音声認識などのパターン認識における曖昧性を削減する、日本語文書を対象としたコーパスに基づく統計的言語モデルを提案する。第2章では日本語の文字n-gramモデルに焦点を当て、2種類のスムージング法の比較評価をパープレキシティにより行う。第3章では、高精度な言語モデル構成法として文字と単語のn-gramを融合する新しい枠組を提案する。第4章では、知識を必要としない、自己組織的統計的言語モデルが提案される。このモデルはsuperwordと呼ぶ概念、すなわちコーパス内で再現性を持つ文字列を用いるものである。第5章では、言語モデルに基づく文字認識アルゴリズムが2種類提案され、パープレキシティと誤認識率との関係が実験により評価される。その結果、提案したモデルが認識時の誤り減少に有効であり、その性能が前章までのパープレキシティによる評価を反映したものになっていることがわかった。
一覧に戻る