TR-HIS-0001 :2001.11.30

早川徹,加藤宏明

音声データベースの自動音素セグメンタの評価

Abstract:本実習では、自動音素セグメンタの精度評価を目的とし、ATRSPRECを用いた自動セグメンテーション法の獲得、ATR連続音声データベースBセットを用いた実験、結果の分析を行った。Bセットに付与された視察によるラベリングの時間データを正解として、誤差を評価する。実験を通して、自動セグメンテーションを行う際の問題点を洗い出し、そのいくつかには対処した。また、ATRSPRECを用いた音響モデルの話者適応法も習得し、実験に取り入れた。結果分析では、話者適応が自動セグメンテーション精度向上に有効であること、音素境界部が無声区間側に張り出す傾向にあること、同系統音素連続の境界部では、境界誤差が大きくなる傾向があることなどがわかった。以上の傾向をキャンセルするような処理を施すことにより、自動セグメンテーションの精度向上が望まれる。