TR-IT-0265 :1998.6.22

塚田元,中嶋秀治,伴敏雄,山本博史

音声翻訳システムのための日本語音声認識言語モデル ('98年6月版)

Abstract:TDMT形態素に基づく日本語言語モデルについて解説し,それを用いた連続音声認識 実験について報告する.現在,音声翻訳通信研究所では,日英音声翻訳システム (日英MATRIX)が稼働をはじめており,音声翻訳システム全体としての評価を進め つつある.また,音声認識部と言語翻訳部をより密接に結合することで,音声翻訳性 能を高める研究も盛んになってきている.これらの要求に答えるため,TDMT品詞 体系に基づく言語モデルを作成・公開する.本モデルにより,はじめて本格的な音声 翻訳実験が可能となる.本稿では,目的別に(1)研究用言語モデル,および(2)MATRIX用言語モデルの二種類を作成し,従来のモデルと認識率の観点から比較実験を 行った.その結果,どちらのモデルとも,従来のモデルと同等の性能が得られること を確認した.