
−人間情報通信研究所プロジェクト終了
プロジェクト終了にあたって
高次視覚情報処理の研究
−3次元世界やイメージを認識する視覚の働き−
(株)ATR人間情報通信研究所 第二研究室長 赤松 茂
1.脳で創り出される3次元とイメージの世界
人物やそれをとりまく環境について視覚を通じて得られる3次元情報、さらには人間の感性に基づくイメージは、コミュニケーションで重要な役割を果たしている。そこで、目から入力された2次元画像情報から、これらの高次の視覚情報が脳内で生成される過程の工学的モデル化を目指す研究に取り組んだ。前者に関しては人間の視覚の能動的な性質に注目し、「視て動く、動いて視る」という観測行動制御と一体化した能動的視覚システムの実現につながる要素技術の確立を目指した。後者については、イメージの研究対象として「顔」を選び、人間が顔からイメージを認知する特性を探り、その知見をコンピュータで顔のイメージを認識・生成する技術に応用することを目指した。
2.「視て動く、動いて視る」を目指して
与えられた画像から3次元世界を復元しようとする従来の受動的な方法に代わって、ここでは視覚の能動的な性質に学び、カメラを動かすことで対象の認識に有利な画像を選択していく能動的アプローチでの信頼性の高い3次元情報の獲得を目指した。まず、動画像から運動物体の特徴点を自動追跡して3次元形状をほぼ実時間で求める実験システム構築に成功した。また、現在の入力画像と目標の状態で期待される画像との差が小さくなるようにカメラの姿勢や特性を変化させる視覚サーボの原理に基づく観測行動の制御技術を開発した。これらの成果により、あたかも人間が手にした物を眺め回しながら認識するように、観測の行動を制御しつつ3次元物体を認識する能動的な視覚認識システムの基本技術が得られた[1]。
3.顔が伝えるイメージを探る
人間は相手の顔からその人物が誰か[個人性]、どのような人か[属性]、どのような気分か[情動]についての様々な視覚イメージを読みとっている。このような人間による顔のイメージをコンピュータでも取り扱うことを目指して、イメージを左右する特徴要因を明らかにすべく「顔のイメージを探る」研究に取り組んだ。画像生成技術の進展により、顔という対象を2次元から3次元、偶発的事例から相関のあるサンプル集合、そして静的な事象から動的な事象へ拡張し、視覚刺激としての顔パターンを自在に制御できるようになったので、その変化に応じて人間に認知されるイメージとの関係を心理実験を通じて定量的に明らかにした。その結果、3次元物体としての顔認知の基本的性質、顔の形態特徴の分布と印象との関係、表情表出の動的特性と認知される感情との関係など、顔イメージの認知要因に関して学術的に高く評価される知見[2][3]が得られた。さらに「顔のイメージをさばく」技術への応用を目指して、人間のイメージ認知特性とよく整合する顔パターンの特徴表現法を検討し、顔画像を人物属性や表情によって分類する実験システムを構築した[4]。また、人間によるイメージを効果
的に可視化する「イメージを創る」技術にも取り組み、実在する顔画像から視点や表情を変化させた仮想的な顔のイメージを画像として生成する手法を考案した[5]。