TR-S-0012 :2000.9.29

野間啓介,村井和昌

口周囲画像による頑強な発話検出

Abstract:現在使用されている発話区間検出手法として音声のパワーに対して発話区間を検 出するものがあるが、騒音環境に対しては、音声のパワーが正確にとれないことによ り正確に発話区間が検出できない。そこで、話者が発話していない際には口を閉じる という仮定のもとで、話者の唇の輪郭情報をactive contour model SNAKESを用い て検出し、発話区間検出において騒音環境下の頑強さを高めることを目的とする。