TR-I-0211 :1991

ShiNya YAMAFUKU & Masahide SUGIYAMA

TDNN-HMM-LRによる文節音声認識

Abstract:TDNN (Time Delay Neural Network) は高い音素識別能力を持つことが示さ れている。その後TDNN-LRとして、文節認識系が構築されたが、確率的なマ ルコフモデルであるHMM-LRには文節認識率においては十分な性能は実現 できていない。これはHMM-LRにおいて行なわれている、全探索に対 して、音声時系列と音素記号系列との記号列間のマッチングになっているこ とや、時間情報(音素継続時間の情報など)が十分に表現されていないこと などが原因と考えられている。ここではTDNN-LRではDPが用いられてい るのに対して、LRとHMMを用いて接続することを検討する。この音素認 識に対しての性能はすでに報告したので、ここでは文節認識に対する性能の 評価について述べることにし、その性能、問題点などを明らかにする。