TR-IT-0324 :2000.1.11

竹澤寿幸,荒川直哉,森元逞

統計的手法による部分木併合

Abstract:自然な話し言葉を対象に通常の句構造解析を行おうとすると、非文法的な表現に対しては全体の構 造が得られず、しばしば断片的な部分木構造の集まりを得る。本稿では、これらの部分木構造を併合 して、文全体の構造解析を与える試みについて述べる。頑健な併合処理を実現するために統計的手法 を用いた。そのための統計データは旅行会話コーパスから得た。本稿では、併合処理について詳しく 述べるとともに、文節単位に分解された木構造データベースを本手法に基づいて再構成する実験につ いて報告する。