TR-I-0063=TR-A-0040 :1988.12

鹿野清宏,片桐滋, 中村雅己, 田村震—, アレックス ワイベル, 沢井秀文,パトリック ハフナー, 東倉洋一, エリック マクダーモット, 船橋賢一

ニュ-ラルネットワークの音声情報処理への応用

Abstract:高速の並列処理計算機が利用可能になり、大規模並列処理も見近になって くるとともに、多層パーセプトロン型のNeural Network のBack-Propagation と 呼ばれる学習アルゴリズムが見直されてきた。音声の分野でも、音声の規則合成 での文字から音韻への変換規則の発見に用いられた。音声認識の分野でも、 Neural Network を用いた少数カテゴリの認識が行われ、従来技術に匹敵する認 識率が報告され始めた。 Back-Propagation アルゴリズムは、単にカテゴリの識 別だけでなく、規則の発見や、空間の写像の問題にも適用が可能である。 ATR自 動翻訳研究所では、次の適用領域を考え、検討を行っている。(1)カテゴリの識 別:Time-Delay Neural Network による音韻識別。(2) 空間の写像 :波形入力によ る雑音処理。 (3) 規則の発見:単語カテゴリのN-Gramモデルによる単語カテゴリ の予測。以下、これらのアプローチについて例をあげて概説する。 さらに、 Back-Propagation 以外のアプロー チとして、ATR視聴覚機構研究所で行われて いる Kohonen のLearning Vector Quantization に基づいた音韻認識についても 紹介する。