Yasuhiro KAWATA and Kashioka HIDEKI
An Overview of Statistics Based Natural Language Processing:
Japanese Morphological and Syntactic Analysis
Abstract:本稿では、我々の統計的言語処理手法を概説する。統計的枠組みによる形態素・構文解
析では、大量の分析済の学習データが必要である。コーパスに基づき文法を開発する環
境、開発した日本語文法の概容、その文法に従って作成した日本語ツリーバンクについ
て報告する。また、文法開発とツリーバンク作成に用いたツール、作成したツリーバン
クデータを、学習データとして使用して処理する統計的日本語解析の現状と、今後取り
組むべき問題点についても検討した。