Toshiyuki TAKEZAWA, Tsuyoshi MORIMOTO
Transformation into Meaningful Chunks by
Dividing or Connecting Utterance Units
Abstract:自然で自発的な発話を対象とする音声翻訳ないし音声対話システムヘの入力としての発話は文に
限定できない。一方、言語翻訳処理における処理単位は文である。話し言葉における文に関して、計算
機処理から見て十分な知見は得られていないので、文の代わりに「言語処理単位」と呼ぶことにする。
まず、一つの発話を複数の言語処理単位に分割したり、複数の発話をまとめて一つの言語処理単位に接
合する必要があることを、通訳者を介した会話音声データを使って示す。次に、ポーズと細分化された
品詞のN-gramを使って、発話単位から言語処理単位に変換できることを実験により示す。