平原達也
音声録音系の諸特性
Abstract:音声科学や音声工学の分野において、人間が発話した生の音声を録音してそれ
を素材に用いることは日常的に行なわれている。当研究室でも、様々な音声デー
タが収録されデータベース化されるとともに、収録した音声の分析や収録した音
声を用いた聴取実験等が行なわれてきている。
技術的な進歩によって、マイクロフォンや録音装置の諸特性は昔とは比較にな
らないほど改善されてきている。しかし、これまでのところこの録音系に対する
定量的な評価はまったく成されておらず、てきとうなマイクロフォンを用いてて
きとうに録音した音声データを、てきとうにA/D変換して計算機に取り込んだ
ものを音声素材として用いているのが現状である。
音声信号から逆フィルタ法を用いて声帯音源波を推定するような場合には位相
特性が平坦な録音系を用いないと期待した波形は得られないであろうし、音声合
成の原音声としてS/Nの悪い、歪の多い音声資料を用いていると高品質な合成音
ができないのはいうまでもない。また、音声知覚の実験に用いる音声素材に録音
系の周波数特性が重畳している場合には知覚的なCueを誤って推定してしまう可
能性すらある。
本レポートでは、現在のATR視聴覚研究所・聴覚研究室における音響信号の
録音系の諸特性について述べるとともに、この録音系の問題点について述べる。