TR-I-0290 :1992.12

山本寛樹, 村上仁一, 嵯峨山茂樹

HMMによる言語モデルの自動獲得の検討

Abstract:従来のHMMによる言語のモデル化の研究では、単語を品詞などのカテゴリーに分類した言語データをHMMの学習に用いていた。これに対して本研究では、カテゴリー分類を与えずに単語列のみをergodic HMMに学習させて、確率つきネットワーク文法と同時に単語のカテゴリーの自動獲得も試みた。その結果得られたergodic HMMは、従来の確率つきネットワーク文法と類似した形態をしており、単語を従来の品詞より、文中での機能に従って、さらに細かいカテゴリーに分類していた。また、openデータとclosedデータの文生成尤度に大差がなく、HMMの獲得した文法は一般性があるとことも示された。これにより、ergodic HMMを用いて確率つきネットワーク文法を自動生成し、単語を分類できる可能性が示された。更に、得られたHMMに対して連続文音声認識実験を試みた。