TR-H-0004 :1993.3.22

川戸慎二郎

2回逆投影法による複数画像からの3次元情報の抽出

Abstract:これまでにも2次元画像から3次元の情報を抽出するさまざまな方法が提案されている。 複数画像を利用する最もシンプルな方法は2眼立体視法であるが、画像間での対応付けの問題が非常に難しいことが指摘されている。誤対応避けるために3眼立体視法が提案されているが、本質的な問題はかわらない。 これに対し対応点の探索過程が不要になるとして、エピポーラ平面画像解析法と称される、カメラを直線移動させながら連続的に撮像した画像列(時空間画像)から3次元の情報を抽出する方法が提案されている。この手法によれば対応点探索問題はより容易な直線抽出問題に置き換えられる。 浜野らは、エピポーラ平面画像解析法でカメラ運動が直線運動に限定されていることは著しい制約であり、かつ直線運動だけでは効率よく視差を大きくできない、またエピポーラ平面画像に現れる直線の抽出もオクルージョンやノイズによって頻繁に分断されているためそれほど容易でないとして、時空間画像から3次元のボクセル空間に重みつきボーティングをおこなうという方法を提案している。これによれば任意のカメラ運動が可能で、かつ画像間での対応点探索や特徴点追跡を全く必要としない。彼らはどのボクセルにボーティングするかをきめるのに、画像に現れた特徴点を空間に逆投影している。逆投影という点ではシルエット像からの3次元物体の再構成に似ているが、逆投影の対象が特徴点という点で、アルゴリズムや、結果として得られる3次元情報に大きな違いがある。 本研究は浜野らとは独立になされたものであるが、画像をボクセル空間に逆投影するという意味では類似の手法を提案するものである。ただし、浜野らが仮定している「画像の撮影頻度は、時空間画像中で連続な特徴点軌跡が形成されるのに十分なほど高い」という条件は必要としない。また誤対応点抑制のために、浜野らが工夫した時空間トンネル画像を逆投影する代わりに2回逆投影を行うことを提案し、結果的にボクセル空間から集積点を検出するための複雑な計算を不要とした。さらにボクセルサイズが大きくてもそこに特徴点が含まれるかどうかを評価できることが浜野らとの大きな違いで、そのためオクトツリーのデータ構造をもちいて、粗いボクセルから始めて順次特徴点の含まれるボクセルのみを再分割していく効率のよいアルゴリズムを組むことができる。実験の結果、オクルージョンなどで「見え」の回数が低い点も抽出できることを確認した。