声の個性を決めるもの



1.はじめに
 音声は日常使われるもっとも重要な通信手段のひとつです。音声は活字と異なり、言語情報以外に、話者の個人情報など、さまざまな非言語情報をもっています。たとえば、声だけで、話者の性別、年齢、出身地および発話時の気分などが伝わり、電話で相手が名乗らなくても、親しい相手なら誰からかかってきたのか分かります。同時に複数の人が発言している中から、特定の人の発言に注目できるのも声の個人差のおかげです。この意味で、声の個性はわれわれの日常生活に深くかかわっています。本文では、声の個性を決める諸要因のうち、発声発話器官の形に由来する声の個性について考えてみようと思います。

2.声の個性を生ずる仕組み

 人間の音声生成機構は、発声器官(声帯)と発話器官(声道)に分けられます。声帯の振動による準周期的な波形あるいは声道内の狭めに発生する空気の乱流を音源とし、顎や舌や唇などの動きにより変形する声道でいろいろな音色が加わります。声の高さは、声帯の振動周期によって決まり、声の音色には、声帯波、空気の乱流、声道内の共鳴など、いろいろな要因が寄与しています。
 声の個性を決めるものは、音声の生成に関与するこれらの発声器官と発話器官の形状と動きにおける個人ごとの差異です。この個人差には、生まれつき備わったものと、習慣として身についたものとがあります。前者は、話者の年令・性別や発話器官の寸法に関連し、後者には、方言や育った環境などが含まれます。

3.声道形状と声の個人性
 声道形状と音色(音声の音響特性)との関連性を解明するため、千葉と梶山は1930年代にX線撮影により母音ごとの声道形状を系統的に分析し、母音のスペクトルを計算するという画期的な研究を行いました[1]。その頃は、音の分析にあたりフーリエ調和解析法を手計算で解くか、よくても手回し計算機を使用する時代でした。今日では、一瞬のうちにこの計算を行うことができますが、それでも声の個人性の問題は解決していません。音の分析だけでは、声の音色と声道形状との対応関係が分からないためです。1990年代になると、磁気共鳴画像法(MRI)が声道の計測に用いられるようになりました。われわれも高の原中央病院の協力により、MRIを用いて声道形状の三次元計測を行い、形態的な個人差を研究する機会をもちました。
 図1は、声道の微細構造を考慮に入れた声道のモデルを示しています。このモデルには、鼻腔、副鼻腔および梨状窩が含まれています。発話器官のうち、鼻腔はもっとも複雑な形状を持ち、個人差ももっとも大きいと思われます。鼻腔は形の上から後部、中部、前部に分かれます。鼻腔の後部は一本の管腔ですが、鼻腔の中部では複雑な形をした左右二本の管に分かれます。そして、鼻腔の前部では左右平行の円筒になります。われわれの計測によると、鼻腔の後部、中部、前部の長さの平均値はそれぞれ3.1cm、4.5cm、3.6cmで、相対偏差(標準偏差/平均値)は10%程度でした。容積の相対偏差は、前部鼻腔で11%ですが、後部と中部では26%前後です[2]。また、左右鼻道の非対称性も鼻腔形状にみられる個人差のひとつです。これらの違いが音色の違いを生む要因になります。また、鼻腔と口腔の結合度は、弁の働きをする軟口蓋の厚さや上下運動の程度により決まり、ここにも形態的、機能的な個人差がみられます。
 鼻腔には、主鼻道以外に副鼻腔と呼ばれる空洞が数多く存在しています。主な副鼻腔には蝶形骨洞、上顎洞、前頭洞があります。上顎洞の容積がもっとも大きく約38cm3で、次は蝶形骨洞で20cm3前後、前頭洞がもっとも小さく8cm3程度です。副鼻腔容積の相対偏差は、蝶形骨洞は14%、上顎洞は13%、前頭洞は27%です[3]。これらの副鼻腔は、細い導管を通して鼻道と交通する分岐管で、音響的には反共振の谷が生じます。風邪を引いた場合、副鼻腔の導管が粘膜により封鎖されると、はな声となって音色に変化が生じます。
 声道にあるもうひとつの分岐管は梨状窩です。梨状窩は、声帯の近く、食道の入口にあるふたつのロート型の管腔です。模型実験などから、この分岐管により4〜6kHzの周波数領域に大きな谷ができることがわかりました。梨状窩に水を注入するとこの谷が消失するので、因果関係が実験的に明らかになったわけです。さらに、梨状窩は声帯の近くに位置するために、母音の第1共振ピーク(フォルマント)にも影響を与えます。梨状窩の寸法は人によって多少異なりますが、発話時に声道形状が大きく変わっても梨状窩の形はほとんど変わりません。この不変性が個人性の安定性に貢献すると予想されます[4]。文献によると、音声の高域(4〜6kHz)に含まれる情報のなかに、個人性の特徴が含まれていること、その帯域の情報を用いると話者認識性能を改善できることなどが知られています[5,6]。これより低い帯域の音響特性は発話中に大きく変動するのに対し、高域の特性は長期間にわたっても安定であることも分かっています。この結論はわれわれの声道形態の研究結果とよく一致します。
 声の個人性のもうひとつの要因は、口腔顔面の形の違いにあると考えられます。われわれの研究室ではX線マイクロビーム装置やMRI装置を用いて、母音における声道形状と音声を分析しています。屈曲した声道の水平部分と垂直部分を計測して母音のフォルマントと比較すると、第1フォルマント(F1)周波数は声道の縦の寸法に依存すること、つまり、咽頭腔が長いほうがF1が低いことが分かってきました。これは、F1の周波数が声道後部の長さによりほぼ決まるという知識と一致しています。また、第2フォルマント(F2)は声道の水平部と硬口蓋の横幅と比と関係があり、硬口蓋の横幅が広いとF2が低くなることを意味します。これは、F2が調音点より前方の容積に依存するという仮説とおおむね一致します。

4.結び
 声道形状の差異による声の個人差について研究の一端を紹介しました。声道形状の個人差は声の個性を決める大きな要因です。しかし、音声の個人性を決める要因は数多く存在すると思われ、完全な解明までには相当の時間と努力が必要でしょう。動物の群れのなかで、親は子供を鳴き声によって判別できるといわれます。動物にどのような能力が備わっているかを調べることも、音声研究における未解決の問題への大きな手がかりになるに違いないと思われます。

参考文献


Copyright(c)2002(株)国際電気通信基礎技術研究所