TR-SLT-0007 :2002.03

西村仁志,坂本仁

コーパスから自動抽出した 表現パターンを用いる日本語文生成

Abstract:音声翻訳において、原言語と目的言語の双方の換言処理を行うことで変換処 理の負荷を最小限にしようという試みがなされている。そこで、本稿では、目 的言語の換言処理として、訳語選択、単語の並び替え、削除および補完の必要 な入力を、単言語コーパスから取得したパターン用いて自然な文にする方法を 提案する。本手法では、プレインなテキストコーパスからパターンを自動的に 取得し、それらのパターンを用いて、入力に近く自然な文であると判断した文 を生成する。提案手法の有効性を確かめるために実験システムを構築し、評価 実験を行った。その結果、入力全体の57~77%の文について効果があることが 分かった。