TR-IT-0099 :1995.2

村上仁一

単語のN-gramを利用した音声認識アルゴリズムと自由発話 認識

Abstract:本論文では単語のn-gramモデルを使用した連続音声認識システムの概要と自由発話認識の問 題点と解決方法について述べる。自由発話を認識するにあたって、特に問題になるのは、冗長語 (間投詞)や言い淀み、言い直しである。このような現象は、認識性能が高い音響モデルを作成 することを困難にすると考えた。そこで本論文では特に言語モデルに着目した。そして仮名や漢 字や単語のN-gramを利用することを考えた。言語のN-gramモデルは確率モデルの中で最も基 本的なモデルである。しかし、確率付き文脈自由文法などの他の言語モデルと比較すると、Perplexityが 最も低いと考えている。このN-gramを用いて自由発話認識を行なった。この実験結 果について述べる。