TR-IT-0159 :1996.3

大井耕三,隅田英一郎,飯田仁

意味的類似度と多義解消に基づく文書検索手法

Abstract:本報告では、(1)質問中の単語と文書中の単語との間の階層的シソーラスに基づ く意味的類似度、(2)質問中の複合語の各単語に類似している文書中の単語間の物理 的近さ、(3)文書内の出現頻度と全文書中の出現文書数に基づく単語の重要度、の3 つの尺度に基づいた質問ー文書間の関連度計算に加え、コーパスに基づく単語の多 義解消手法を導入した文書検索手法について述べる。英語の標準的テストセットを 使って実験を行なった結果、単語の重要度で拡張したプーリアンモデルに基づく従来 手法に比べて精度の向上を確認した。