


自動翻訳電話の基礎研究
…7年間の区切りとこれからへの期待
ATR自動翻訳電話研究所 代表取締役社長 榑松 明
ATR自動翻訳電話研究所における7年間の区切りを迎えるにあたって、これまでの自動翻訳電話の基礎研究を振り返るとともに今後の発展的研究への期待を述べる。
1.話し言葉の音声翻訳
自動翻訳電話は、話し言葉による会話音声を相手言語に翻訳して音声合成で出力する音声翻訳システムを、双方向に用いる。自動翻訳電話の要素技術である、大語彙連続音声認識、話し言葉言語翻訳、自然性の高い音声合成のそれぞれを高度化し、かつこれらを組み合わせた音声翻訳システムを構成することは、大いにチャレンジングな研究であった。特に、省略や断片的な表現を含む話し言葉をコンピュータで理解して翻訳する研究は、世界でもまだどこもやっていなかった。研究の目標として、語数や扱える言語表現の豊富さなどかなりの規模の研究を行うことにしていたので、グラウンディングのしっかりした基礎研究の方向づけをどのようにするかについては、大学の先生方にも適切な助言をして頂いたことに深く感謝している。
話した音声は、言語情報を伝えるものであるから、音声と言語を一体化して処理することが不可欠である。音声の認識処理と記号の言語理解の処理とをいかに統合するかは、なかなか苦労した点であった。ATRでは、音声と言語の研究を一つの場所で集中して、音声および言語の研究者が一体となって身近に議論をしながら研究することができたことが、この分野で世界に先導した研究成果をあげることができた要因の一つであると考えている。
これまでの研究によって、区切りをいれて丁寧に発声し、文法的にかなった話し言葉の表現をするようにして人間がシステムにあわせるよう制限すれば、小規模での自動翻訳電話実現の橋頭保が築かれたと言えよう。
2.データベースと共通のテストベッドの重要性
話し言葉の音声と言語の研究では、対象が人間が話したり表現するものでいわばいきものであるため、実際の場面に照らして問題の所在を的確に把握し、それを解決していくことが重要である。そのためには、音声と言語のデータベースを収集して分析することが必須である。ATRでは、発足以来、音声および言語データベースの構築をはじめた。これは、我が国のコーパス*オリエンテッドな音声言語研究の先駆けとなった。データベースの構築には、多大なマンパワーと費用がかかる。ATRがこの面で努力して、共通に使えるものを集めて、ラベルをつけ品質をチェックした上で外部にも提供できるようにしたことは、研究の促進に大いに役立ってきた。
音声認識、言語翻訳、音声合成の各要素技術の高度化の研究は、比較的長い期間にわたって研究が継続され、性能の向上が図られる。その際、どのように技術が進歩したかを、定量的に評価することが重要である。音声認識では、認識率あるはい理解度で測られる。言語翻訳の場合には、翻訳の品質で評価される。音声合成の場合は、合成音声の品質で評価される。差がどのようになったかを把握しながら技術を進歩させるための、評価用データおよびそれぞれの要素技術のアルゴリズムを用意しておく必要がある。ATRでは、研究の中期頃より、評価用データを用いた評価ができるようになった。この結果にもとづく論文は、質および信頼度が高いと評価された。国際的にみると、異なる言語に適用した場合にどうなるかとの質問をよくうけた。これからの課題である。
3.国際研究協力
自動翻訳電話の研究には、相手言語がかかわることから、国際研究協力が不可欠である。日本語と相手の異なる言語の両方の研究が必要であるが、ATRでは、その言語を母国語とする所で主たる研究をすることが重要との考え方により、日本語の音声認識、日英言語翻訳、日本語の音声合成のそれぞれに研究の主眼をおいて進めた。英日音声翻訳にかかわる英語の音声認識、英日言語翻訳については、アメリカ、イギリスをはじめとする海外の研究機関との国際的研究協力を積極的に進めた。研究員の交流や内外の研究者の協力と助言があった。
自動翻訳電話は、いくつかの要素技術からなるシステムである。個別の要素技術を高める個別研究だけでは、問題の解決にはならない。リアルタイムに近い形で音声を翻訳して、人間同士で会話するというソフトウエアシステムを構成するシステム的研究が欠かせない。ATR自動翻訳電話研究所における国際研究協力においては、海外のよき研究パートナーにめぐまれ、共通ドメインでの国際共同実験が実施できるように進展した。去る1月28日の日米独国際共同実験では、それぞれ自国語の音声翻訳の技術に責任を持つという考え方で、インターフェースを簡単にして翻訳結果の文字列として伝送することで、約1年の比較的短い準備期間をかけて、スムーズにデモンストレーションが成功した。今後も、研究レベルの向上をねらいとして、適当なタイムインターバルを定めて、研究面での研究結果を国際的な共通ドメインで、適切な方法で外部に紹介することが研究の活力となろう。
4.今後の研究への期待
実用的自動翻訳電話システムには、用件を伝えたいような場合に、人が普通に話す言葉が自由に相手に翻訳されるような、人間にあわせられる自然なシステムでなければならない。今後の研究では、(1)適切に設定されたチャレンジングな目標に対して、マイルストーンを意識しながら研究を進めていくこと、(2)音声および言語の処理の融合化したポテンシャルの高い研究をたゆみなく行うことが重要であろう。
自動翻訳電話システムは、リアルタイムに音声および言語の処理をするため、コンピュータ技術の進歩に密接に関連している。コンピュータの性能向上を考慮にいれて、音声や言語表現の変化に対応できるいわゆるロバスト(頑健)な処理技術と、自然な会話の音声合成技術と、大規模な音声言語に容易に拡張ポテンシャルをもつ技術が必要である。世界的規模でこの分野の研究開発が活発化が進み、人が使いやすい自動翻訳電話が早く実現することを期待している。
終わりに、これまで多大なご支援とご激励を頂いた内外の各方面の方々に厚く御礼申し上げる。また、ATRにおいて研究に励んできた研究員諸氏には、その努力と熱意に対して心から感謝する。