TR-I-0305 :1993.3 ( Internal Use )

藤原紳吾,杉山雅英

HMMとエキスパートシステムの手法を用いた 音素セグメンテーションシステムと ラベリングワークベンチ

Abstract:音声情報処理システムの研究開発に必須である音声データベースの効率的作成・保守のための音素セグメンテーションシステム、および音素ラベリングワークベンチの研究開発の成果を報告する。開発したワークベンチはユーザーインタフェース・モジュールと音素セグメンテーション・エンジンから構成される。ユーザ・インタフェース部はX Window Systemを利用しており、マウス操作により簡単にラベリングを実行できる。音素セグメンテーション実行部はHMMとエキスパートシステムの手法を用いており、その性能は、音素境界誤差の平均が12ms(単語データ)、14ms(文データ)であった。また、ワークベンチを使用して作成したラベルデータの境界誤差は平均約6ms、標準偏差約10msであり、従来の視察ラベリング作業で得られるデータとほぼ同じ精度であった。本報告では、ワークベンチの構成・操作性・性能について述べ、さらに、我々が実際に構成したシステムについて説明し、そのパーフォーマンスと作成したラベルデータの精度について報告する。