TR-I-0211

TR-I-0211 :1991

ShiNya YAMAFUKU & Masahide SUGIYAMA

TDNN-HMM-LRによる文節音声認識

Abstract:TDNN (Time Delay Neural Network) は高い音素識別能力を持つことが示されている。その後TDNN-LRとして、文節認識系が構築されたが、確率的なマルコフモデルであるHMM-LRには文節認識率においては十分な性能は実現できていない。これはHMM-LRにおいて行なわれている、全探索に対して、音声時系列と音素記号系列との記号列間のマッチングになっていることや、時間情報（音素継続時間の情報など）が十分に表現されていないことなどが原因と考えられている。ここではTDNN-LRではDPが用いられているのに対して、LRとHMMを用いて接続することを検討する。この音素認識に対しての性能はすでに報告したので、ここでは文節認識に対する性能の評価について述べることにし、その性能、問題点などを明らかにする。