山口晃,内海章,宮里勉
手振り画像データベースの構築と認識手法の検証
Abstract:臨場感通信会議システム[1]などの仮想空間操作システムではマンマシンインターフェースとして手振りが利用される例が多い。そのようなシステムにおいては、手振り入力デバイスとして多くの場合「データグローブ」のような装着型の装置が用いられている。しかしこのような装置は装着に手間がかかるなど使用者への負担が大きく、非装着型の装置の実現が望まれる。我々は複数のカメラをもちいた画像処理ベースの手振りの認識装置について研究を進めている。
我々の手法では、手のひらが平面形状であることを仮定することで、長袖の衣服を着用した場合のように手の平領域が腕の部分から分割されて得られる場合については、既に安定した認識動作が得られている[2][3]。我々はシステムの自由度を増すために手のひら領域と腕領域の分割を仮定しない手法について現在開発を進めている。
従来の認識手法では、最初に手の輝度情報から手の領域だけを切り出して2値化し、手の平の重心位置を検出していた。しかし領域が分割されていない場合には、この重心位置の検出が正しく行なえない。そこで、重心位置を示す特徴量として画像のスケルトンに着目し、得られた重心候補(スケルトン)について、種々の特徴量から重心らしさを評価して重心位置を決定することとした[4]。その際、重心に加えて射影の極小点を手首候補とし、重心-手首の組を評価の対象としている。候補点群の中から4つの特徴量に基づいて、真の重心と手首を推定する。重心位置の決定ができれば、その後の処理については従来の手法がそのまま適用できる。
本報告では、重心手首推定の過程においてどの特徴量が正確な認識を行なうのにより必要かの検証を行う。