山本和英,隅田英一郎
TDMT用形態素解析プログラム
(日本語/英語/韓国語)
ー性能評価報告ー
Abstract:変換主導型機械翻訳(TDMT)用の形態素解析プログラムの性能について報告す
る。本システムは高い頑健性を目指して品詞と単語の混合n-gramモデルを採用して
おり、現TDMTシステムが翻訳対象としている日本語、英語、韓国語をほぼ同一の
機構によって処理している。評価結果の概要は以下の通り。日本語は公開されている
他の高精度の形態素解析プログラムと比較してほぼ同等の精度であり、かつ他とは異
なる話し言葉固有の表現も処理できることが確認でき、解析時間も問題なかった。英
語は解析能力、解析時間共に全く問題なく、韓国語はこれら二言語に準ずる性能を示
してはいるがまだ向上の余地があることが明らかになった。