鹿野清宏,片桐滋, 中村雅己, 田村震—, アレックス ワイベル,
沢井秀文,パトリック ハフナー, 東倉洋一, エリック マクダーモット, 船橋賢一
ニュ-ラルネットワークの音声情報処理への応用
Abstract:高速の並列処理計算機が利用可能になり、大規模並列処理も見近になって
くるとともに、多層パーセプトロン型のNeural Network のBack-Propagation と
呼ばれる学習アルゴリズムが見直されてきた。音声の分野でも、音声の規則合成
での文字から音韻への変換規則の発見に用いられた。音声認識の分野でも、
Neural Network を用いた少数カテゴリの認識が行われ、従来技術に匹敵する認
識率が報告され始めた。 Back-Propagation アルゴリズムは、単にカテゴリの識
別だけでなく、規則の発見や、空間の写像の問題にも適用が可能である。 ATR自
動翻訳研究所では、次の適用領域を考え、検討を行っている。(1)カテゴリの識
別:Time-Delay Neural Network による音韻識別。(2) 空間の写像 :波形入力によ
る雑音処理。 (3) 規則の発見:単語カテゴリのN-Gramモデルによる単語カテゴリ
の予測。以下、これらのアプローチについて例をあげて概説する。 さらに、
Back-Propagation 以外のアプロー チとして、ATR視聴覚機構研究所で行われて
いる Kohonen のLearning Vector Quantization に基づいた音韻認識についても
紹介する。