近年、音声認識の精度が著しく向上し、様々な場面で利用されるようになっています。しかしそれに伴い、話者によってはシステムが認識しにくい場合があることが問題となっています。この展示では、音声認識システムを話者の声の性質に応じて最適化する「モデル適応技術」に関する研究を紹介します。従来、話者適応には長時間の観測と多くの計算量が必要でした。本研究の成果により、数秒のみの音声データを用いて即座にモデルを話者に適応させ、様々な声に対して更に認識率を向上させることができるようになりました。
ポスターの画像をクリックすると、PDFファイルが開きます。