「声の乱れ」に耳を馴らす

Computers can be more Liberal for a Deformed Speech



(株) ATR音声翻訳通信研究所 第一研究室 中村 篤



「いろいろな人」によって話された「自然な話し言葉」には、本を朗読したときのような整った音声とは違って、至る所に「乱れ」が含まれます。私たちは、人間がそれらの乱れを苦にせず言葉を聞き分けるのと同じように、コンピュータにも声の乱れに慣れてもらい、より自然な人間と機械のコミュニケーションを実現したいと考えています。ここでは、コンピュータを声の乱れに馴らすための新しい方法を紹介します。

In contrast to well-formed speech such as that produced when reading a book, spontaneous speech is much more liberal in its structure. Computers need to be more flexible in the processing of spontaneous speech if they are to realize natural human-machine communication. In this paper, we introduce a novel algorithm to prevent computers from being affected by apparent deformation in speech.


本文へ