TR-H-0310

TR-H-0310 :2001.2.7

藤田覚

MRI-based Extraction of Vocal Tract Shape and Construction of a Physical Vocal Tract Model

Abstract:音声合成は単純な声道形状を仮定して行われるが、実物の声道の形状は複雑である。そこで磁気共鳴画像(MRI)データより声道の3次元形状を復元し、それを解析すればより精密な音声合成の知見が得られると考えられる。また、実体モデルを作成し、人工音源で駆動して音声合成することも考えられる。さらに、実体モデルに変形などの解析操作を施すことが可能であり、音声合成の人間らしさあるいは人間の発声機構の解明に役立つと考えられる。この報告では頭頚部のMRIを元にした声道の3次元形状データの抽出方法を述べ、母音の形状の特徴、および男性話者3名の声道について比較した形態的特徴を述べる。また声道の変形操作による合成音比較実験についても簡単に述べる。