ShiNya YAMAFUKU & Masahide SUGIYAMA
TDNN-HMM-LR Applied to Phrase Recognition
Abstract:TDNN (Time Delay Neural Network) は高い音素識別能力を持つことが示さ
れている。その後TDNN-LRとして、文節認識系が構築されたが、確率的なマ
ルコフモデルであるHMM-LRには文節認識率においては十分な性能は実現
できていない。これはHMM-LRにおいて行なわれている、全探索に対
して、音声時系列と音素記号系列との記号列間のマッチングになっているこ
とや、時間情報(音素継続時間の情報など)が十分に表現されていないこと
などが原因と考えられている。ここではTDNN-LRではDPが用いられてい
るのに対して、LRとHMMを用いて接続することを検討する。この音素認
識に対しての性能はすでに報告したので、ここでは文節認識に対する性能の
評価について述べることにし、その性能、問題点などを明らかにする。