Kozo OI, Eiichiro SUMITA, Hitoshi IIDA
Document Retrieval System Based on
Semantic Similarity and Word Sense Disambiguation
Abstract:本報告では、(1)質問中の単語と文書中の単語との間の階層的シソーラスに基づ
く意味的類似度、(2)質問中の複合語の各単語に類似している文書中の単語間の物理
的近さ、(3)文書内の出現頻度と全文書中の出現文書数に基づく単語の重要度、の3
つの尺度に基づいた質問ー文書間の関連度計算に加え、コーパスに基づく単語の多
義解消手法を導入した文書検索手法について述べる。英語の標準的テストセットを
使って実験を行なった結果、単語の重要度で拡張したプーリアンモデルに基づく従来
手法に比べて精度の向上を確認した。