Takehiro Nakajima, Hirofumi Yamamoto, Yoshinori Sagisaka, Masaru Takano, Satoru Tsuge
音声タイプライタにおける
子音の認識誤り傾向
〜 ngの脱落現象の解析 〜
Abstract:本稿では、音響モデルの高性能化を目指す前段階として、Multi-Class Composite N-gramを用い
た音素タイプライタ用言語モデルによる音素認識実験の結果をもとに、音素の認識誤り傾向の調査を行
なった。特に本稿では、脱落数の多い子音ngに対象を絞り、HMnetの構造(使用されている状態、フ
レーム数)、音素の連鎖(音素系列)、話者の相違に着目した認識誤り解析を行なった結果を報告する。