Hajime Tsukada, Hideharu Nakajima, Toshia Ban, Hirofumi Yamamoto
Japanese Language Models
for Continuous Speech Recognition
in Speech Translation System
(June 1998 release)
Abstract:TDMT形態素に基づく日本語言語モデルについて解説し,それを用いた連続音声認識
実験について報告する.現在,音声翻訳通信研究所では,日英音声翻訳システム
(日英MATRIX)が稼働をはじめており,音声翻訳システム全体としての評価を進め
つつある.また,音声認識部と言語翻訳部をより密接に結合することで,音声翻訳性
能を高める研究も盛んになってきている.これらの要求に答えるため,TDMT品詞
体系に基づく言語モデルを作成・公開する.本モデルにより,はじめて本格的な音声
翻訳実験が可能となる.本稿では,目的別に(1)研究用言語モデル,および(2)MATRIX用言語モデルの二種類を作成し,従来のモデルと認識率の観点から比較実験を
行った.その結果,どちらのモデルとも,従来のモデルと同等の性能が得られること
を確認した.