TR-SLT-0025

TR-SLT-0025 :2002.8.31

Yoichi YAMASHITA, Tomohiro TANI, Tomoko MATSUI

Automatic Finding of Structure in Spoken Dialogues by Clustering

Abstract:音声対話における構造の自動抽出を実現するための要素技術として、対話における発話のクラスタリングおよび会議音声における話者セグメンテーションについて述べる。音声対話における発話は、質問・応答などの発話タイプや対話における話題などの対話の状況によって、言語的な特徴が異なっている。クラスタリングによって類似した発話をまとめ、複数の言語モデルを作成することによって音声認識の性能が改善することを示す。合わせて、対話における典型的発話系列を自動抽出するための基本的アイデイアについて述べる。次に、会議音声の話者セグメンテーションを行うために、多数話者との類似度によって発話の話者性を表現して発話を話者ごとに分類する手法について述べる。