柿ケ原康二,泉昌明
文節候補選択処理のための係り受けデータ
Abstract:ATR自動翻訳電話研究所では日本語の言語現象を明らかにする上で必要
となる各種の基礎データを収集した大規模な言語データベースの構築を目指して
おり、その1つとして言語データベースに格、係り受け関係を記述している。こ
の格、係り受け関係のデータは係り受けの構文関係、意味関係等の詳細な記述が
なされており、さまざまな言語処理の基礎データとして利用できるものであ
る。
現在この係り受け関係データを用いて、音声認識結果の文節ラティスの文節候
補から最適な候補を選択する手法の検討を行っている。特に、そのままでは適用
できない部分に対してデータ構造の変換と、個々の単語に意味素性の付加を行っ
た。本稿では変換後の係り受け辞書データの内容とその作成手順について説明する。