竹澤寿幸,荒川直哉,森元逞
統計的手法による部分木併合
Abstract:自然な話し言葉を対象に通常の句構造解析を行おうとすると、非文法的な表現に対しては全体の構
造が得られず、しばしば断片的な部分木構造の集まりを得る。本稿では、これらの部分木構造を併合
して、文全体の構造解析を与える試みについて述べる。頑健な併合処理を実現するために統計的手法
を用いた。そのための統計データは旅行会話コーパスから得た。本稿では、併合処理について詳しく
述べるとともに、文節単位に分解された木構造データベースを本手法に基づいて再構成する実験につ
いて報告する。