Japanese / English

文献の詳細

言語 日本語
著者 森 大毅
論文名 言語の確率モデルを利用した文字認識に関する研究
年月 1995年3月
要約 n-gram(n字組)モデルは自然言語の局所的性質を良く近似するが、全てのn-gramの出現確率を推定するに足るサンプルを入手することはできない。この確率を精度良く推定するため、2種類のスムージング法、すなわちフロアリングによる方法と削除補間法による方法を検討する。各々のモデルはパープレキシティと呼ばれる尺度によって近似の精度を評価され、その結果、削除補間法による予測能力が優れていることが示される。 3種類の文書に対する認識実験の結果、言語モデルを用いない場合の認識誤りのうち 75%から90%が正しく認識されることがわかった。
一覧に戻る