藤田覚
MRI-based Extraction of Vocal Tract Shape and Construction of a Physical Vocal Tract Model
Abstract:音声合成は単純な声道形状を仮定して行われるが、実物の声道の形状は複雑である。そ
こで磁気共鳴画像(MRI)データより声道の3次元形状を復元し、それを解析すればより
精密な音声合成の知見が得られると考えられる。また、実体モデルを作成し、人工音源で
駆動して音声合成することも考えられる。さらに、実体モデルに変形などの解析操作を施
すことが可能であり、音声合成の人間らしさあるいは人間の発声機構の解明に役立つと考
えられる。
この報告では頭頚部のMRIを元にした声道の3次元形状データの抽出方法を述べ、母
音の形状の特徴、および男性話者3名の声道について比較した形態的特徴を述べる。また
声道の変形操作による合成音比較実験についても簡単に述べる。