Katsushi ASAMI, Toshiyuki TAKEZAWA, Genichiro KIKUI
Detection of Topic and Speech Act Type on Utterance-by-utterance Basis
for Spoken Dialogue Processing
Abstract:音声インタフェースでは,音声認識によって音声から変換されたテキストに基づく情報抽出や加工・
変換処理が本質である.本論文では,その基本技術として,1発話毎に話題および発話行為を推定す
る手法を提案する.提案手法は,まず訓練段階において,話題および発話行為タグが付与された訓練
データから,単語と話題および発話行為の関連性を示すスコアを求める.実行段階では,入力された
発話に含まれる単語に関して,訓練段階で求めたスコアの和を話題毎および発話行為毎に求め,その
大小の順位付けによって,入力発話の話題および発話行為を推定する.ここで用いるスコアは,訓練
データ中の単語と話題および発話行為の出現パターンに関する相互情報量と,単語の出現パターンに
関するエントロピーから求める.提案手法は,単語と話題および発話行為の1対1の関連性のみを利用
し,複数単語の共起などを考慮しないことから,音声対話において多く観察される文長の短い発話に
も有効に機能する.旅行会話でよく使われる発話表現を用いた実験の結果,誤認識を含む単語列に対
して,話題推定の正解率は約83%,発話行為推定の正解率は約70%であった.