TR-IT-0006 :1993.7.29

竹沢寿幸,田代敏久,保坂順子,衛藤純司

自動翻訳電話研究所の対話データベースと音 声翻訳システムASURAの音声認識用文法・構 文解析用文法の間の日本語形態素情報の相違点

Abstract:ATR自動翻訳電話研究所で開発された対話データベースと、音声翻訳システムASURA で使われた音声認識用文法・構文解析用文法は、それぞれ別の目的のために独立に開発され てきたので、日本語形態素においてさまざまな差異(大きく分けて、品詞の設定の差異、語 の分割の差異、表記の揺れの3種類)が存在している。新しい音声言語データベースにおける 日本語形態素情報の体系を検討するために、それらの間の日本語形態素情報の差異を調査したの で、その内容を述べる。