TR-C-0047 :1990.3.28

徐剛

最終報告書

Abstract:私はATRに一年半ほど滞在させていただきました。最初の半年は研修研究員(その最初の数カ月は週一回程度の来所)として、後の一年は客員研究員として。途中、世の中も私自身も色々な事が起こったので、この一年半はだいぶ長い、そしてまた非常に短いような感じが致します。日本では、年号が換わった、中国では、天安門事件が起こった、ヨーロッパでは、ベルリンの壁が撤去され始めた。そして、私も北京大学に行く計画を改め、大阪大学に戻ることにしました。このように、毎日目を新聞から離せない中、ATRでの滞在期間は三回(身分変更一回含めて)も延長しました。とにかく、困難な時に居場所を提供して下さったATRの皆様に深く感謝致します。 さて、研究の話に戻りますが、私は、臨場感通信、仮想空間通信会議システムの一部となっている顔のモデリングと認識に関する研究を担当しました。遠隔地に居る各参加者の三次元モデルを仮想の会議室に写し込み、そして仮想の参加者間位置関係に一致した画像を生成することによって、臨場感を作り出すというユニークな発想です。顔の3次元モデルは再生画像の質に直接関係することから、重要視されています。モアレ法や光切断法などの方法では、正確なモデルが得られるが、特殊の設備が要るので、あまり実用ではありません。従って、カメラからの入力画像から顔の3次元モデルを作ることが要求されます。これが私の最初の仕事でした。 私のもう一つの課題は、顔表情の認識です。表情の認識ができれば、認識の結果だけ伝送して、受信側で3次元モデルに表情の変化を加えることにより、表情のある顔画像を再生できるという"夢”です。この夢が何時実現するか分からないが、顔表情の認識自身が一つ重要な研究課題であってきました。人間にとって非常に簡単であっても、計算機にとって非常に困難な一好例です。von Neumann型計算機でなく、ニューラルなアプローチについて考察を行ないました。最後、私の本来の分野であるコンピュータビジョンについても研究を続けています。内容は線画の解釈ですが、通信の立場からとらえても有意義であると思われます。画像を線で表現し、伝送して、それを受け取った側で解釈し理解するというように、知的通信の枠組にも入る。 本報告は以上の三つの研究の内容をまとめたものです。それぞれの間は必ずしも論理的関係が存在するわけではありません。第一部は、顔の3次元モデル化に関するもので、電子情報通信学会論文誌Eへの投稿(阿川、永嶋、岸野、小林と共著)からなっています。第二部は、顔表情の認識に関するもので、テクニカルレポートとして提出する予定の原稿(永嶋、岸野と共著)からなっています。第三部は、線画の解釈に関するもので、International Journal on Artificial Intelligenceへの投稿(田中と共著)からなっています。第二部の内容については、実験を行なっていないので、構想の域に留まっている。今後、どなたかのお役に立てば、幸いと存じます。