TR-H-0115 :1994.12.26

志沢雅彦

物体の運動と形状の3次元復元と操作のための体系的計算理論

Abstract:第1章では、計算機に視覚の機能を与えるためのコンピュータビジョンの研究を概観する。まず、視覚研究の方法論として、Marrの提唱した3段階の水準を説明し、その中での本研究の位置付けを述べる。さらに、本研究を含む周辺技術について、その工学的応用の可能性について述べる。 第2章では、動画像処理の基本であるオプティカルフローの計算理論を演算子形式の重ね合わせの原理に基づいて拡張する。複数の運動を画像の各点に同時に検出する多重オプティカルフローの計算理論とアルゴリズムが展開される。次に、2眼ステレオ視の基本処理である視差検出の理論を拡張し、多重視差の計算理論を導く。理論を展開して、2重視差を一撃的に計算するアルゴリズムとそのネットワーク表現を導出する。最後に、多重情報に関する基本拘束方程式を導出・表現する統一的方法を提案する。これは、演算子形式の重ね合わせの原理の数学的一般化である。 第3章では、拡張された重ね合わせの原理を用いて、運動からの構造復元の基本問題を拡張し、複数運動を直接扱う計算理論を導く。この理論を用いて、2個の独立な物体の3次元運動と3次元構造を同時に数値的に計算するアルゴリズムを導く。次に、ビジョンにおける不良設定問題を解くための一般的枠組である標準正則化理論を重ね合わせの原理を用いて多価関数の正則化に拡張する。拡張された正則化理論を用いて、重なり合った複数枚の表面を同時に復元する超並列アルゴリズムを導く。 第4章では、計算機内部で、物体の形状や位置を表す座標値やベクトル量、テンソル量の座標変換(剛体運動、アフィン変換、射影変換)を量子化誤差の存在に関わらず、完全に可逆に行う理論を提案する。 第5章は、結論であり、本研究のまとめと今後の課題を述べる。