工藤育男
キーボード会話解析ツール解説書
Abstract:キーボード会話文の解析ツールについて述べる。会話文を解析する上で重要なファクター
として、ロバスト性とリアルタイム性がある。ここでは、会話文によく出現する非文法的な文
として、フラグメント、省略を含む文を扱う。また、リアルタイム処理の実現のために、解析
過程を、入力処理、構文解析、格解析の三段階(3パス)にし、入力処理段階で落とせるものは、構文
解析に行く前の段階で落としてしまう(“early constraint”)。また、構文解析では、格関係
が決まらないので、次の格解析まで未決定のままにしておくという手法("lazy evaluation")をと
る。さらに、処理の効率化を計るため、入力処理の結果を利用し、セグメンテーションを行
い、構文解析過程の高速化を実現するというヒューリスティックスを導入する。その結果とし
て、キーボード会話300の文章に対して、準リアル・タイムの処理が可能になった。また、語彙につ
いては、3700エントリー(活用形を含む)用意されており、ツールとして、誰でも利用できるように
した。