TR-IT-0269 :1998.08.31

河田康裕,柏岡秀紀

統計的言語処理による日本語形態素・構文解析

Abstract:本稿では、我々の統計的言語処理手法を概説する。統計的枠組みによる形態素・構文解 析では、大量の分析済の学習データが必要である。コーパスに基づき文法を開発する環 境、開発した日本語文法の概容、その文法に従って作成した日本語ツリーバンクについ て報告する。また、文法開発とツリーバンク作成に用いたツール、作成したツリーバン クデータを、学習データとして使用して処理する統計的日本語解析の現状と、今後取り 組むべき問題点についても検討した。