



音声翻訳通信研究所プロジェクト終了
プロジェクトの成果について
「高度音声翻訳通信の基礎研究」の成果概要
(株)ATR音声翻訳通信研究所 代表取締役社長 山本 誠一
ATR音声翻訳通信研究所は、1993年の設立以来7年間にわたって進めてきた高度音声翻訳通信の基礎研究を、本年2月末で終了する。1980年代に開始されたNECの先駆的な研究やATR自動翻訳電話研究所の基礎研究は、音声翻訳が実現可能であることを実証したが、そこで採用された文法に基づく音声認識技術や言語翻訳技術では、対話に代表される日常の自然な話し言葉を適切に翻訳することは極めて困難であった。
これを受けて開始された高度音声翻訳通信の研究目標は、日常の自然な話し言葉を相手の言語に翻訳するための要素技術を確立することである。すなわち、特別な言語運用知識を持たない一般の方が、特に訓練なしに利用できるような音声翻訳システムを実現するための要素技術を確立することである。このため、日常の対話に関する大規模コーパスを作成し、各要素技術についてコーパスに基づく研究手法を採用した。研究計画としては、発足から当初4年間は自然な話し言葉を認識、翻訳、合成するための要素技術の研究を進め、後半3年間はこれらの要素技術を統合して総合的な評価を進める計画を設定した。各要素技術の研究成果については、以下に各研究室長がその詳細を記述するので、ここでは統合化された音声翻訳技術に関する研究成果について述べる。
異なる言語間での対話を音声翻訳する技術の評価や技術課題の把握には、双方向で動作する音声翻訳システムが必要である。このような考えに基づき、1998年に各要素技術を統合し、旅行予約に関する対話を対象に、語彙数一万語を越える日英双方向音声翻訳システムを開発し、様々な観点から音声翻訳技術の評価を進めた。その結果、旅行予約に関する対話については実時間で音声翻訳可能であり、5段階の主観評価でも3.8点と、「少し不満が残るが用件を満たすことができる」という評価を得る段階に達している。さらに、様々な英語運用能力を有する日本人と音声翻訳結果の質を一対比較した結果、現在の音声翻訳技術の翻訳は、TOEICスコアー500点台の日本人による話し言葉の翻訳結果に匹敵することが判明した。TOEIC公開テストでの大学生の平均は約570点であることから、14年前のATR自動翻訳電話研究所発足時に、「夢の自動翻訳電話」といわれた技術は、翻訳できる対話の対象は旅行の予約に限定されるものの、いよいよ外国語を十年近く学習中の人間とも比較ができる段階に入った訳である。
なお、旅行予約を対象にATR音声翻訳通信研究所で研究開発した技術を、電話料金や市外局番等の質問に答える対話に適用した結果、ほぼ同等の翻訳性能が得られることが確認されており、ATR音声翻訳通信研究所で研究開発した音声翻訳技術は、他の対話にも適用可能であることも実証済みである。ただ、それには対象の対話コーパスの収集が必要であり、様々な対話に全てこの収集作業を実施して利用範囲を広げるのは困難である。既に十分な量が利用可能な新聞等のテキストコーパス等を活用して効率的に音声翻訳システムの利用範囲を広げる手法等は未開拓であり、その開発は今後の課題である。
以上述べたように、ATR音声翻訳通信研究所での7年間の研究の結果、対話を対象とした音声翻訳技術は、対話の対象が限定されている場合、「少し不満が残るが用件を満たすことができる」との評価を得て、TOEICスコアー500点台の日本人に匹敵する段階に達するような大幅な進展を見た。しかし、詳細に観察すれば、音声翻訳システムの翻訳結果が、TOEICスコアー500点台あるいはそれ以上のスコアーの日本人の翻訳結果を上回る評価を得ているのは、主としてエントロピーの小さな比較的単純な発話であり、複雑な発話については評価が下がる。すなわち、抜群の記憶能力により基本問題は好成績を上げるが、組み合わせの複雑な応用問題はまだ一層の努力が必要な状態である。さらに、日本からの積極的な情報の発信が今後ますます重要になることを考えると、途中での聞き返し等が許される日常対話の音声翻訳技術以外に、複雑な発話から構成される講演などでの利用を可能とする、より高度な音声翻訳技術、すなわち同時通訳技術の研究が待たれるところである。