竹沢寿幸,田代敏久,保坂順子,衛藤純司
自動翻訳電話研究所の対話データベースと音
声翻訳システムASURAの音声認識用文法・構
文解析用文法の間の日本語形態素情報の相違点
Abstract:ATR自動翻訳電話研究所で開発された対話データベースと、音声翻訳システムASURA
で使われた音声認識用文法・構文解析用文法は、それぞれ別の目的のために独立に開発され
てきたので、日本語形態素においてさまざまな差異(大きく分けて、品詞の設定の差異、語
の分割の差異、表記の揺れの3種類)が存在している。新しい音声言語データベースにおける
日本語形態素情報の体系を検討するために、それらの間の日本語形態素情報の差異を調査したの
で、その内容を述べる。