3次元形状の表現
−立体画像を効率的に記述し、自然に表示する−




ATR通信システム研究所 知能処理研究室 Daniel Lee田中 弘美、岸野 文郎



1.はじめに
 ATR通信システム研究所では、仮想的に作成した会議室に参加者の像を写し込み、遠隔地にいる人々があたかも一堂に会する感覚で会議を行うことができる、臨場感通信会議の実現に向けて、要素技術の研究を進めています[1]
 臨場感通信会議では、その概念を図1に示すように、相手人物像や議題の対象となっている3次元物体(図では自動車の精巧なモデル)が立体的に表示されます。この場合、実世界と同じように、視点の移動に応じて表示内容が変化したり、対象物をあたかも直接手で操作するかのように表示内容が更新されれば、臨場感は増大します。このためには、任意の3次元物体を入力、認識し、受信側で視点に合せて再構成、表示する必要があり、3次元物体をどのように表現するかが重要な研究課題の一つとなります。この表現法には、3次元物体形状データを効率的に伝送、蓄積できること、異なる曲面を正確に区別でき、視点の変化に対して不変であること、再構成に効率的なアルゴリズムが利用できるようにコンパクトであることなどが要求されます。
 人物像を対象とした場合は、すでに文献[1]で紹介したように、会話時の顔の動き、表情などをリアルタイムで伝送する必要があり、また基準の人物モデルのみを蓄積しておき、通信時に相手人物の特徴に応じて変形させるので、圧縮率よりも処理が簡単な表現が要求されます。一方、会議中の話題となる3次元物体を対象とする場合は、予め入力して蓄積しておくことができ、また対象物も大量になることも想定されますので、入力時の処理時間よりは、圧縮率が高く、品質に優れた、効率的な表現が要求されます。
 ATRでは、任意の3次元物体を対象に、圧縮率の高い、効率的な2種類の表現法の検討を進めています。1つは、表面を小領域(パッチ)に分割する方法で、物体表面の特徴は記述できませんが、比較的処理が簡単です。他の方法は、物体の表面形状を解析し、境界線などを幾何学的特徴により表現する方法で、物体が本来的に持つ特徴を記述できるので、圧縮効率の向上、及び物体認識など広範な適用が期待できます。以下にこれらの方法の概要を紹介します。

2.パッチ分割による形状表現
 表面を、小領域の基本単位である三角形に分割する方法は、3次元物体の形状を表現するための最も基本的な方法です。この表現法では、表面を先ず粗い近似面にあてはめ、近似が良くない部分を対象に、段階的に近似の精度を上げていく、適応的再分割法により高精度化を図ることができます。近似面として用いる面素片は、最も簡単な三角形の平面パッチから、ベジアパッチのような複雑な曲面パッチまで、どのようなものであってもかまいません(脚注1)。この方法は、柔軟性が高く、さまざまな物体の形状を表現することが可能で、また、データ量の面でも比較的効率が良いため、通信分野での3次元物体表現モデルとして適しています。また、リアルな合成画像を生成し、それを操作するのに用いられる、現在のコンピュータグラフィックスの技法とも良くマッチしています。
 光切断法[2][3]によって得られる3次元形状データを多面体近似するアルゴリズム、さらにそれを拡張して、ベジアパッチに変換するアルゴリズムを考案しましたので、これらについて簡単に説明します。光切断法では、物体中心座標として、円柱座標系(γ、θ、Ζ)を用います。ここでは(θ、Ζ)で表される直線上で物体の形状をサンプリングすることにより、距離データを得ています。一般に距離データは、測定基点から3次元物体表面の各点までの距離として与えられます。ATRのシステムは、θ方向で1度、Ζ方向で1mm(最大値500mmのとき)の分解能を持っています。(図2
 3次元サンプル点データの集合から三角形分割を得るための方法として、計算幾何の分野で多くの最適化アルゴリズム、ヒューリスティックアルゴリズムが一般に適用されていますが、3次元サンプル点データを、体積誤差が最小となるように、多面体で近似する方法を新たに提案しました。この方法は、以下の手順で実行されます。
ステップ1:Ζ軸上の1mm間隔のすべての値、Ζjについて、物体の横方向の断面積Sjを求める。
ステップ2:Ζjに対するSjの値の変化を、誤差が一定値以下になるように区分的直線近似を行う。これにより得られる間引かれた断面がΖ方向の代表点候補として残る。
ステップ3:ステップ2で残った横断面について、その外周を区分的直線近似し、その折れ線の端点を三角パッチの頂点とし、Ζ方向に隣合った断面の近い点同士を結ぶことで三角パッチが得られる。
 この方法では、誤差の許容値を調節することにより、生成される三角パッチの大きさを制御することができます。近似による歪みが許容できるかどうかの判断は、現状では主観評価が重要な評価基準ですが、ここで用いた体積誤差による評価は、良い客観評価手法を開発するための1つの指針になるものと考えています。
 この手法を、ベジアパッチを再分割していく方法に新しく拡張しました。曲面パッチを用いることにより、曲面物体のよりよい表現を生成することができます。この方法では、まず、ベジア曲線でパッチの境界線を近似し、次に、曲面をベジアパッチで再帰的に近似していきます。上記のアルゴリズムのステップ2では直線近似を行っていましたが、ここではベジア曲線による近似を用います。近似が良いかどうかの判断には、三角パッチの場合と同様に体積誤差による評価を用います。この方法の最大の特徴は、本質的に、パッチ境界における連続性が保証されているという点にあり、これは、2次のベジア曲面が境界で連続するという性質によります。
 このアルゴリズムにより、光切断法で入力した3次元物体をデータ圧縮/再構成した結果を図3に示します。ベジアパッチでは、三角パッチと比較して表面が滑らかな3次元物体の場合、同一のデータ量で体積誤差が1/2以下になります。また、図3で明らかなように、髪のように表面形状が複雑な部分の特徴は三角パッチに比べよく再現されていることが確認できました。

3.幾何学的特徴による形状表現
 3次元形状データを更に効率よく圧縮できること、適用領域を拡大できることなどを目指し、構造的な情報を持つ表現の検討を進めています。臨場感通信会議においては、前にも述べたように、視点移動、対象物体への働きかけ、などにより任意方向からの画像を表示する必要があり、方向に依存せず、物体が本来的に所有する特徴で表現することがポイントとなります。
 ここでは自由曲面と呼ばれる任意形状の凹凸などで構成される曲面を対象とし、微分幾何学に基づく局所的な特性を用いて、表面を記述することを検討しました。距離データから表面を後述の曲面スケッチ法という手法を用いて記述するためには、曲面率(脚注2)などの幾何学的特徴を求める必要があります。距離データから曲面率等を算出するためには各点毎に周辺のデータを考慮にいれて膨大な計算を行う必要があります。そこで等高線データ(例えばモアレ縞法[4]で得られる)に着目し、まず、このデータから曲面率等の幾何学的な量を求め、次に、これらの量を用い、各点を凸点、凹点、鞍部点、尾根点、谷点などに分類し、ラベル付けを行う手法を提案しました。これにより、構造的に完全で、かつコンパクトな物体記述法を確立することができました。等高線データから曲面率などのパラメータを算出し曲面の特徴を記述できること、計測データのように数学的に連続性が保たれない場合も算出できること、を明らかにしました。以下に具体的な計算ステップを定性的に説明します[5][6][7]
(1)面の分割
 まず、それぞれの等高線に沿って、特徴点として曲率の特異な点を検出します。モアレ等高線の曲率を調べることにより、等高線のみから以下の2種類の特徴点を見つけ出すことができます。
 (a)等高線の端点:等高線が途切れる点であり、距離情報の不連続点を示し、物体を背景から分離する遮蔽輪郭線が存在することになります。
 (b)等高線の曲率の極値:等高線の傾きが大きく変化する点で、傾きの異なる2面の交差する稜線上の点の存在を示します。
 次に隣合った2つの等高線上の同じような特徴点を連結していくことにより、面に分割されます。
(2)面曲率の算出
 次に分割された各面に対して、表面固有の幾何パラメータを抽出します。一般に、等高線データは距離情報が疎であり、しかも観測された方向に依存しているため、従来これらのパラメータを求めるのは困難でした。幾何パラメータを抽出するには、最終的には図4に示す法線nが求まれば脚注2に示したように所望の曲面率が求められることになります。先ず、等高線C2の点Mにおける接線tを図4のように決定し、次に接線tに垂直な平面と、両隣の等高線C1、C3との交点P1、P2を求めます。3点P1、M、P2は接線tに垂直な平面PO上にあり、この3点を通る円(中心C)は一意に決定されます。点Mにおける法線nは、CからMへの向きとして得られます。
 このように等高線データから曲面率を算出する手法を確立するとともに、この計算で生ずる誤差の限界を示す式も導出しました。計算された値は、光学系の分解能の範囲内で正確であること、計算結果は安定であること、全距離データから算出するより大幅に計算量を圧縮できることも示すことができました。
(3)曲面スケッチ法
 面曲率が算出された曲面に対して、その表面構造は凸領域及び凹領域輪郭線、谷線、尾根線などの曲率構造線と呼ばれる記述子で記述することができます。これらの構造線は曲面の幾何学的な特徴を効果的、かつ自然に抽出したもので、曲面の大局的な凹凸構造を階層的に記述する特徴線になります。これらの記述子による物体の記述は視点の移動の変化に不変のものです。これらの記述子は計測データの連続性が保たれない場合にも数学的に正当に定義できることを示しました。
 更に、尾根線、谷線、および、凸部、凹部をとり囲む輪郭線など大局的な凹凸構造によって表現される曲面スケッチによって、任意の曲面形状を推定できるような定式化も行いました。
 モアレ装置を用いた距離データは、表面の等距離線という形で得られ、また、曲面構造を記述する構造線は、面に固有な特性から導き出されているため、これらは表面の本来の特徴を示す記述として使うのに適当なものといえます。
 図5に形状解析の一例を示します。(a)の等高線で与えられる曲面(ダブルシニュソイド)は、(b)に示すような構造線で記述されることになり、実際に算出された凸領域、及び凹領域輪郭線を(c)に示します。
 上述の曲面スケッチ法により得られる記述から、曲面物体を再構成することができます[5]。現在、計測データを元に検討中です。また曲面の特徴をパラメータで記述できるため、3次元物体の認識等の適用領域が想定されます。

4.まとめ
 3次元形状の表現方法についての研究を簡単に紹介しました。最も基本的なレベルの表現である三角形分割による方法、及び曲面パッチへの拡張について述べました。また、等高線データから形状記述を抽出する方法の概略を紹介しました。曲面固有の性質は曲面率などの幾何特徴に基づいて得ることができ、これを用いることによって、精度、計算速度、ロバスト性の面で有利となることを示しました。
 今後、この手法が表面再構成に有効なことを示すとともに、3次元物体認識等への適用を検討していく予定です。



参考文献