沢井康孝,菊井玄一郎,山本博史
音声翻訳システムの音声認識出力詳細度と翻訳性能
の関係
Abstract:音声翻訳において、音声認識と翻訳のモジュール間は前者の出力を後者の入力
とする方式を取っている。しかし、前者の出力で多義解消を行い漢字表記にする場合
と、多義解消を行わず読みだけにする場合について、何がモジュール間において適切
なのかは明らかではない。前者で詳細な情報まで決定することにすれば後者の負担
は軽減されるが、前者で誤りが生じるリスクが増大する。実験では、音声認識出力の
形式をいくつか設定し、翻訳の原言語側コーパスをこれに対応するよう変更を加え、
音声認識出力に応じた翻訳処理性能を比較した。結果、翻訳側の負担を増やしても
翻訳精度の低下には繋がらないと考える。