TR-I-0279 :1992.9.4

粟津辰功,磯谷亮輔,嵯峨山茂樹

助詞の連鎖統計を用いた言語モデルと その音声認識への応用

Abstract:音声認識に用いられる統計的な言語モデルとして、単語のbigram, trigramなどの連鎖統 計が有効であることが知られている。しかし従来の方法では、文節間の係受け関係のような大 域的な言語情報の表現が困難である。一方、文節ベースの連鎖統計は、そのままでは文節の種 類が多いため実用的ではない。本報告では、文節内の特定の文法カテゴリに着目した単語の連 鎖統計を用いることにより、より大域的な言語情報を獲得しうる言語モデルを提案する。予備 的な実験として、文節末にあらわれる助詞の一文中での連鎖統計をテキストデータベースより 求め、それを文節認識に適用する実験を行なったので、その結果について報告する。