TR-IT-0265

TR-IT-0265 :1998.6.22

Hajime Tsukada, Hideharu Nakajima, Toshia Ban, Hirofumi Yamamoto

Japanese Language Models for Continuous Speech Recognition in Speech Translation System (June 1998 release)

Abstract:TDMT形態素に基づく日本語言語モデルについて解説し，それを用いた連続音声認識実験について報告する．現在，音声翻訳通信研究所では，日英音声翻訳システム（日英MATRIX)が稼働をはじめており，音声翻訳システム全体としての評価を進めつつある．また，音声認識部と言語翻訳部をより密接に結合することで，音声翻訳性能を高める研究も盛んになってきている．これらの要求に答えるため，TDMT品詞体系に基づく言語モデルを作成・公開する．本モデルにより，はじめて本格的な音声翻訳実験が可能となる．本稿では，目的別に(1)研究用言語モデル，および(2)MATRIX用言語モデルの二種類を作成し，従来のモデルと認識率の観点から比較実験を行った．その結果，どちらのモデルとも，従来のモデルと同等の性能が得られることを確認した．