TR-A-0005 :1987.6.9

片桐滋

スペクトログラムリーディング

Abstract:本報告は、音声のスペクトログラムリーディングに関する技術的紹介を行っている。音声のスペクトログラムは、音声波形が持つエネルギーをある時点一周波数における濃淡表示として視覚表現したものである。スペクトログラムリーディングは、このスペクトログラムを音声や言語に関する様々な知識を用いて人間が「読み取る」技術であり、この読み取り過程で用いられる人間の能力を音声認識システム等の構築に応用することを目的としている。 本報告では、初めに、スペクトログラムリーディングの方法と、人間が逹成できる「読み取り能力」に関する研究成果を紹介する。次に、スペクトログラムリーディングを工学的に応用するために行われている研究アプローチの中から、知識処理技術を用いた音声認識システム構築の試み、音声信号処理と記号処理との双方を効率よく実現しようとする研究環境の整備、スペクトログラム上の音響的特徴を把握するために必要な音声データベースの整備について、現状を整理する。最後に、スペクトログラムリーディングに基づく音声研究において、今後解決すべき課題を提起する。