TR-A-0136 :1992.3.9

天白成一

UNIX上の音声研究用ツール - SpeechTools -

Abstract:音声・聴覚の研究においては、音響信号波形をA/D変換して計算機上に取り込み、そ の波形やスペクトルあるいは信号処理結果を表示したり、波形やスペクトルを加工/編 集したり、加工/編集した信号をD/A変換して聴いたりすることが必要であり、このよ うな一連の作業を効率良く行えるか否かは大きな問題である。そこで、このような作業 を支援するために音声研究用ソフトウエアツール(SpeechTools)開発してきた。 SpeechToolsは、広くUNIXをOSとする計算機上で利用することができ、音声分析・ 合成に関した各種のアルゴリズムを単一のインタフェースを通して使用できるコマンド と種々のデータ形式の変換等を行うユーティリティとそれらを支えるライブラリによっ て構成されている。 SpeechToolsの対象分野としては音声の研究全般を考え、音声分析・合成等に関した 確立された技術を提供することを主目的とした。そして、SpeechToolsは大きな一つの プログラムではなく、小さな機能ごとに個別に分けられたコマンドの集合体として設計 されており、コマンドを連結することでより多くの目的に利用できるようになっている。 また、データ変換などを行うユーティリティとしては、acat(アスキーデータからバイ ナリデータヘの変換)、bcat(バイナリデータからアスキーデータヘの変換)、bcalc (2項演算を2つバイナリデータファイルに実行)、cv(各種バイナリデータのフォー マット変換)、merge(アスキーデータの列の併合)、separate(アスキーデータの列 の分割)、smath(アスキーデータの科学算術演算)の7個があり、ライブラリとしては、libcommand.a(ファイルの入出力、コマンドのインタフェース等を含む)、libmx.a(行列演算を含む)、libst.a(音響分析・合成、DFT、高次方程式の解法等を含む)、 libtlist.a(簡易なリスト処理を含む)の4個がある。プログラムは、すべてC言語で 記述されており、総行数は約2万行である。また、マニュアルは、すべてroff形式で記 述されており、オンラインで読むことができる。