TR-SLT-0006

TR-SLT-0006 :2002.2.26

村井和昌,加藤秀和

データベースに基づく顔向き推定

Abstract:近年，音声情報に加え，唇動画像の情報を利用するマルチモーダル音声認識は，雑音環境下での認識性能向上を目的として，多くの研究が行われている，雑音環境下での音声認識を困難にしている要因の一つとして，マイクから入力された音が音声か雑音かを識別できず，雑音をも認識しようとすることが挙げられる．一方，雑音がない環境下においても，認識して欲しい音声かそうでない音声かどうかを識別できないといった問題がある．そこで本研究では，認識対象者が認識機を向いて話しているとき，認識機を作動させることを前提として，顔画像情報を利用した顔向き推定を目的とする．本研究の顔向き推定は，予め用意しておいた複数の方向を向いた顔領域テンプレートの相関を算出することによって行う．