Shinichi ANDO, Yves Lepage
Linguistic Structure Analysis by Analogy and Its Efficiency
Abstract:本稿では、ツリーバンクを用いて入力文と類似した文の構文木から入力文に対する構文木を類推する手
法を提案する。この手法は用例に基づく解析手法の1つであるが、入力文とツリーバンク内データとの類
似関係という新たな原理に基づいているため、構文解析における曖昧性解消のための新たな指標が提供
できると考えられる。またこの手法は辞書などを用いず、データ間の類似性のみに基づいて解析を行
うため、未知語などを含む入力に対しても頑健に働く。ここでは特に基本原理として働く類似関係の有
効性を評価するためにPenn Treebankを用いて評価実験を行った。その結果、単語の表層情報と品詞
情報を用いることで解析可能な文の約70%が一意に正しく解析でき、また誤ったものについても比較的
正解に似た構文木を出力することができた。