TR-IT-0249 :1997.12

脇田由実,匂坂芳典

HMMの状態系列で表された誤認識特性を用いた 正解音素、正解語彙探索手法について

Abstract:従来の音響モデルと認識手段では認識が困難な語彙を獲得するために、下記の特 徴を持つ誤認識特性を用いて、従来認識できなかった正解音素または正解語彙を探索 する手法を提案し、その探索性能を評価した。誤認識特性は次の特徴を持つ。

・誤認識特性がHMMの状態系列として表現されている。

・認識結果の状態系列の各状態のマッチング区間が正しい区間と一致しているか どうかを考慮しながら、ラベル長の制限無しで誤認識特性を抽出する。

本報告書では、まず、上記の誤認識特性の抽出法および誤認識特性を利用した次 の2つの探索方法について説明する。(a)認識結果から正解音素探索行なう方法、(b) 発音辞書作成して正解語彙を探索する方法。 次に探索性能の評価結果を報告する。評価結果は、上記(a),(b)2つのどちらの 探索方法においても、上記に示した本誤認識特性の特徴が、従来認識できなかった音 素系列や語彙を探索するのに優位であることを示している。さらに、誤認識特性の品 詞依存性を考慮しながらマルチ発音辞書を作成することが、より探索性能を向上させ ることも示している。