TR-SLT-0025 :2002.8.31

Yoichi YAMASHITA, Tomohiro TANI, Tomoko MATSUI

Automatic Finding of Structure in Spoken Dialogues by Clustering

Abstract:音声対話における構造の自動抽出を実現するための要素技術として、対話における発話のク ラスタリングおよび会議音声における話者セグメンテーションについて述べる。音声対話にお ける発話は、質問・応答などの発話タイプや対話における話題などの対話の状況によって、言 語的な特徴が異なっている。クラスタリングによって類似した発話をまとめ、複数の言語モデ ルを作成することによって音声認識の性能が改善することを示す。合わせて、対話における典 型的発話系列を自動抽出するための基本的アイデイアについて述べる。次に、会議音声の話者 セグメンテーションを行うために、多数話者との類似度によって発話の話者性を表現して発話 を話者ごとに分類する手法について述べる。