視覚イメージを生成して三次元世界を認識する

Synthesizing Visual Imageries for 3D Object Recognition and Scene Analysis



(株)ATR人間情報通信研究所 第三研究室 安藤 広志



脳の視覚認知システムは、視覚イメージを積極的に生成することにより、能動的な情景認識を行なっていると考えられます。私たちは、このような脳の優れた認知能力をモデル化する研究を進めてきました。この計算モデルでは、三次元物体の物体像を自律的に学習して記憶するとともに、入力からの画像情報と記憶からのイメージ情報を双方向的に循環させることにより、複雑な三次元の情景を柔軟に認識することをめざしています。

The human visual system performs an active recognition of the 3D world by synthesizing visual imageries. We have proposed a neural network model which learns to cluster multiple views of multiple 3D objects, and achieves a flexible recognition of a cluttered 3D scene by bidirectionally integrating the information from an image and the imagery generated from the learned object representations.


本文へ