TR-IT-0068 :1994.09.02 ( Internal Use )

中井満,シンガー ハラルド, 匂坂芳典

アクセントモデルを用いたF0クラスタリング による句境界検出

Abstract:連続音声の認識や理解は非常に困難であり、認識精度、処理効率を上げるためには句境界情報等の支援が不可欠である。しかし、プリプロセッサとして連続音声中の句境界を自動的に検出する手法は未だに確立されておらず、そのため連続音声の認識に膨大な時間とメモリを費しているのが現状である。 したがって、入力音声から直接、あるいは簡易処理によって抽出された韻律特徴量から高速に境界位置の推定を行なうことは非常に重要は課題である。 そこで本報告では従来のパタン連続整合による句境界検出法を基に、アクセントパタンのモデルを仮定することによるシステムの実装、およびその成果をまとめる。 この手法は従来のアクセントF0テンプレートを使用したパタン連続整合に比べて、句境界検出率、句境界挿入誤り率、処理速度のいずれにおいても良い性能を示している。