友清睦子
語用論的分析に甚づく
自然発話の長文分割
Abstract:本報告で述べる長文発話の分割は、自然発話を対象とした日本語会話文の解析・変換・生成を最終目的としている。これまでの機械翻訳は、話言葉は扱ってきたが、自然発話の会話を扱ってはいない。なぜなら、解析の入力は句読点を持つことを前提にしている場合が多く、また日本語の会話に特徴的な接続詞や文末要素でいくつも文がつながった重文構造の発話や、実質的発話以外のもの、すなわち相づち、言い直しなどを含む文を取り扱ってはいないからである。
本報告は、そうした自然発話の特徴の一つである丸や点のない長文の発話を、機械翻訳でいかに扱うかを基本的な課題として書かれる。
分析結果をもとに、一発話をほぼ単文の単位にパラフレーズし、各々にラベルを与え、このラベルの組み合わせと文字列を主たる情報として、長文の分割解析の方法を提案するものである。