驚きは素早く、悲しみはゆっくりと‐表出速度に敏感な表情認知‐



1.はじめに
@@summary_begin@@  最近、テレビのコマーシャルで、合成された顔が出てくるのをよく目にするようになりました。歴史上の有名人に喋らせているものもあります。しかし、そのCG顔が喋るのを見て、なにか不自然さを感じることはないでしょうか。ひとつの要因としては、実際に喋っている人間の顔を見る場合と異なり、表情が乏しく感じられることがあげられると思います。さて、顔を観察している私たちは、顔のどのような特徴を見て、表情を判断しているのでしょうか。
 私たちの研究室では、顔の合成、認識に応用可能な人間の認知機能を探るという観点から、顔のデータベース作成、合成システム開発、認知心理学的実験による考察を進めてきました。
 人間が普段行っている表情の認知については、これまで主に静止画を使ってさまざまな心理実験がなされてきました。しかし、近年ではコンピュータの処理速度や容量の増加、画像合成システムの進歩などにより、動画で実験を行うことも可能になってきました。私たちは、実験刺激に動画を用いることで人間の「動く顔」に対する表情認知の特性を探ろうと試みています。また、そのために個人や表情間の差を統制した実験刺激を作成するのに有効なツールとして、モーフィングによる顔画像生成システム(FUTONシステム:Foolproof UTilities for facial image manipulatiON system)の開発・改良にも取り組んでいます。ここではまず、FUTONシステムの概要を紹介した後、これを用いて合成された動画を刺激とした心理実験の結果から、動きの速度が表情認知に及ぼす影響について説明します。

2.画像合成システム:FUTON
 FUTONシステム[1] では、顔を両目、両眉、鼻、口、輪郭のパーツに分けて定義し、合成を行います。それぞれのパーツは、複数の対応点で囲まれた領域で構成されます。対応点は、専用のソフトウェアを用いて容易に取得することができます(図1)。心理実験に使うためには、刺激の品質を最優先しますので、現在は手動による取得を行っています。この対応点取得が画像の出来を左右するわけですが、初心者でも熟練者でもほぼかわらない精度(平均誤差1〜2dot)で対応点が取得できることが実験により確認されています[2] 。これは、対応点を取得する際に補助線を提示するなどのユーザ補助の機能が有効に働いているためと思われます。

3.動画像の作成
心理実験での動画刺激は、FUTONシステムのモーフィング機能を使って作成しました。元になる二枚の静止画の合成割合を少しずつ変化させた画像を複数枚作成し、それらを連続的に提示することで動画刺激が完成します。例えば100名の顔モデルの動画像を同じ定義で作成したい場合、対応点さえ取得して簡単なスクリプトを書けば、100名分の動画像が容易に作成できるのもFUTONの利点といえるでしょう。また、前述したように、目や口などの特徴ごとに合成の指定ができるため、目だけを先に動かし、口を後から動かすという操作も可能です。次に、全ての特徴を同時に変化させた場合の、速度に対する基本的な認知特性を調べた認知実験[3] についてご紹介します。

4.速度によって違う表情の見え方
 実験では、真顔から強い感情を表した表情(幸福、悲しみ、怒り、驚き)へと変化する動画刺激を被験者に提示しました。この時、最初と最後は同じ画像で、違う速度で変化する動画刺激を3条件(Fast 0.2秒:Medium 0.87秒:Slow 3.3秒)設定しました。被験者にはその表情が何に見えたかを短い言葉で自由に答えてもらい、もともとの静止画が示す感情カテゴリーに該当するような答えが得られれば、仮に正答とみなしました。例えば、真顔から悲しみの表情へと変化した動画を見た場合、「悲しみ」を示すような答えが正答とされます。得られた正答率を図2に示します。図から分かるように、表情から認知される感情と速度との関係は、各表情によって異なることが分かります。特に「悲しみ」の表情については、速度が速くなればなるほど正答率が下がりFast条件での正答率が50%を下回っています。これに対して「驚き」の表情は、逆に速度が遅くなればなるほど正答率が下がってきます。また、興味深いことに、「幸福」や「怒り」が素早く提示されると「驚き」と答える混同が多く、逆に遅く提示されると「悲しみ」との混同があることが分かりました。
 さらに別の実験と分析から、表出速度の変化に応じて、表情からそれぞれの感情カテゴリーを感じる強度の傾向は「驚き」と「悲しみ」の間で対極的な関係にあることが分かり、言い換えれば、表出速度が覚醒水準の違いとも解釈できる次元の認知的要因となっていることが考えられます。

5.おわりに
 「悲しみ」は、遅く提示されないと悲しみと知覚されないことが明らかになってきました。このことから、たとえ素早い提示が可能であっても、悲しみの顔は素早く提示を終わらせてしまうと、せっかくの合成表情が思い通りに知覚されない場合もあるということが理解できると思います。これまでのところ、真顔から基本的な表情へと動く顔に対する特性のみを調べていますが、別の表情同士の組み合わせや、発話と表情との組み合わせなど、研究するべきテーマはたくさん残されています。最終的には、速度情報を利用して「動く顔」から人間が見るのと同じように表情を認識できるシステムの開発へと有効に利用できればと考えています。@@summary_end@@

参考文献


Copyright(c)2002(株)国際電気通信基礎技術研究所