TR-A-0160 :1993.1.30

志沢雅彦

特徴点対応に基づいた 運動立体視におけるトランスペアレンシー

Abstract:互いに重なりあって異なる運動をする2個の剛体の3次元運動パラメータと3次元 構造パラメータを、運動や物体表面のなめらかさ、あるいは、近似的投影モデルなどの 付加的な前提条件なしに、2フレーム間の特徴点対応情報から閉形式の数値計算と一撃 クラスタリングで復元する計算理論とアルゴリズムを提案する。まず、2枚の透視投影 像間の特徴点対応にn個の3次元剛体運動が含まれる場合の基本拘束方程式を、透明 視の普遍的計算理論として著者が提案した重ね合わせの原理を用いて導出する。次に、 2重運動の場合について、2組の3次元剛体運動パラメータを、データの誤差を考慮し て準最適に求める線形アルゴリズムを導出する。 このアルゴリズムは、データにノイズが無い場合は、厳密解を与えることはもちろんであるが、計算の閉形式性を保ちつつ、 中間段階で得られる拘束方程式をできるだけ多く用いる最適化手法を取り入れているた め、誤差が存在する場合にも全体として準最適な解を求めることができる。さらに、 この運動パラメータを用いて対応点の各物体へのクラスタリングと構造復元を行う一撃ア ルゴリズムを導く。特徴点の数が十分多く、それらが特殊な配置に無ければ、一般の運 動パラメータに対して解が一意に定まることが構成的に証明される。最後に数値シミュ レーションによって本アルゴリズムの正当性を示す。

The computatonal theory and an algorithm are presented which can recover 3D motion parameters and 3D structures of multiple rigidly-moving objects from two-frame feature point correspondences without assuming smoothness of motions nor structures, and without approximating geometry of projection onto the image planes. First, the constraint equation for two-fold transparent 3D motion and structure from correspondences in two perspectively projected frames is derived based on the principle of superposition which is a universal computational principle for multiple motion and motion transparency. Secondly, a quasi-optimal linear algorithm is derived which estimates two-fold multiple motions and structures from noisy correspondence data. The algorithm exploits intermediate constraints as much as possible while keeping its closed-form nature. The algorithm can then cluster the correspondences into two rigid objects in a single-shot manner as well can estimate depths of the correspondence points as a result. It is proved constructively that the solution is unique if the motion and structure is not in special conditions. Finally, a numerical simulation is presented for verifying the proposed algorithm.