TR-IT-0174 :1996.06.21

美馬秀樹,隅田英一郎,飯田仁

類似検索を用いた情報検索システム

Abstract:近年のインターネットの普及や,今後期待されている電子図書館の実現等により,膨 大な量の全文データベースが利用可能となるため,必要な情報を効率的に探し出す情 報検索技術が望まれている.この要求に対し,用例検索を目的とした類似検索技術は 一つの可能性を示すと考えられる.類似検索を文書データ等に対する情報検索に応用 することにより,入力文と意味的に類似した文を含むテキストを効率的に検索できる. さらに,類似検索には従来技術と比べ次の特徴がある.1)ユーザは検索キーとして任 意のフレーズや文をそのまま入力することができる.2)意味距離計算により,入力 文と検索対象との表層のばらつきをシソーラスの利用等により自動的に吸収できるた め,ユーザは基本的に検索キーに使う語彙や活用等のバリエーションを工夫する必要 がない.3)意味距離によりマッチングの度合いを適宜調整しながら検索できる.本報 告では,このような類似検索技術を用いた情報検索システムの実現方法について述べ る.