TR-I-0371 :1993.3

浦谷則好,井上健吾

ATR対話データベース検索内容調査

Abstract:数々の言語現象を調査研究する目的でATR対話データベース(ADD)に対して種々の検索が行なわれている。データベースの見直しの資料とするために検索内容の傾向について調査をした。調査項目は、検索の種類、利用したデータとその件数である。期間は1990年4月から1992年12月末を対象とした。調査結果からは次のことが明らかになった。検索対象になったデータは国際会議のタスク(領城)を指定しているものが圧倒的に多く、旅行のタスクのみを指定した検索条件は少数である。キーポード会話、電話会話等のメディアの選択は双方ともほぼ同じ頻度で利用されている。利用データとしては、調査対象とした検索の殆どが何らかの日本語形態素情報を利用している。日本語形態素情報に合わせて対応英語を求めている検索も多く、対応単位としては文対応が大勢を占める。利用データとして英語形態素情報が付与されているデータがADDに反映している量が少なく、また低品質であったため、英語表現を基準とした検索は殆ど見受けられなかった。