


自動翻訳電話への挑戦

ATR自動翻訳電話研究所 代表取締役社長 榑松 明
ATR自動翻訳電話研究所が設立されて、はや5年になる。自動翻訳電話の基礎研究を先駆けて、本格的に研究することになり、これまでに着実に研究が進められてきた。自動翻訳電話の実現のためには、連続大語彙音声認識、話し言葉機械翻訳、会話音声合成の各要素技術の高度化とあわせて、認識と翻訳と合成の処理を結合して実時間に近く高速に行うための複雑なソフトウエア技術が必要で、将来の実用化のための基礎となる技術の研究がわれわれの使命である。
ATRでの研究が開始されると、内外の多くの訪問者が研究所を見に来られた。外国の研究者のなかには、「自動翻訳電話とは随分高い目標(Ambitious)の研究ですね。幸運を祈ります(Good
Luck)。」と言う人もいた。日本のATRでこのような研究を本気ではじめたことに、びっくりするとともに、大いに期待をかけてくれた。実際、音声処理と言語処理の分野を集中して、大規模にしかも安定的に、かつ地道に段階的に研究する状況をみて、認識を新たにした人が多かった。その後、欧米では、音声と言語を一体にして処理をする研究の重要性が認識され、Spoken
Language Systemや音声翻訳といった音声言語の分野の研究が、ATRを含めて世界的に活発化している。
どの分野の研究にも、「研究に王道なし」といわれる。音声認識、機械翻訳、音声合成にかかわる音声言語の情報科学においては、人間が用いる音声や言語を対象とするため、現象がバラエティに富み、かつオープンエンドである。ATRでは、研究が開始されると、音声および話し言葉の研究対象が具体的にどのようなものであるかを把握するのが第一歩であると判断した。音声データベースおよび話し言葉の言語データベースの作成をおこなった。大量のデータをもとに綿密に分析して、音声および言語処理の新しい処理方式を開拓しつつある。ATRで作成した大規模なラベル付きのデータベースは、音声言語処理技術の研究遂行の上で、広くかつ長く有効に役立つものである。
自動翻訳電話で扱う音声言語処理技術は、初期の段階では限定された分野の対話に適用されるとしても、それからさらに分野が拡張されても耐えられるものでなければならない。高速化するコンピューターの処理速度の進歩をにらみつつ、計算量の爆発を引き起こさないような、音声言語処理の基本的アルゴリズムの研究が重要で、ATRではこのための探究を進めている。
自動翻訳電話の目標は、はじめは話し方や言語表現などで種々の制限条件がある段階から、次ぎには自然に使える段階に進み、さらには自由に使える段階へと発展していく。自動翻訳電話の研究により、小規模で限定した使い方のものは、可能性が見えてきつつある。本格的なシステムの実現までには、さらに音声言語の情報科学の研究を、地道にかつ長期的に継続して行く必要がある。