[Japanese|English]
深層学習には学習データとテストデータとで取得条件(ドメイン)にずれがある場合に精度が下がる問題があることが知られています。ドメイン適応とはそれを解決するための技術です。一般的には、ドメインの違いによるデータの分布の差を小さくするように学習することで、ドメインの違いの影響を受けない認識モデルを実現する方法がとられていました。一方で、この方法はデータのドメインを事前に把握する必要がありますが、現実的にはすべてのデータのドメインを把握しておくことは困難です。本研究では、様々なドメインが混在し、なおかつ各データのドメインが未知であっても、ドメインの違いの影響を受けない認識モデルを実現できる手法を提案しました。
本成果では、データごとのドメインの違いを明らかにする新しいデータ拡張を導入することにより、先述の問題を解決しました。具体的には、画像データを対象に、画素ブロックの位置をランダムに入れ替えるデータ拡張を用いることで、自己教師あり学習によって、各データのドメインを推定可能にしました。これによって得られたドメインの情報と既存のドメイン適応技術を併せて用いることにより、ドメインの違いの影響を受けない認識モデルの学習を可能にしました。
図は学習中の特徴空間上での各サンプルの様子を、正解クラスラベルで色分けしてプロットしたものです。従来法では、様々なクラスのサンプルがクラスタを形成しており、ドメインの違いによらない認識特徴の獲得に失敗しているのに対して、提案法では、正解クラスごとにクラスタが形成され、ドメイン非依存な特徴の獲得に成功していることがわかります。
既存の技術では深層学習にできなかったデータも、本研究の成果によって、活用の道が広がり、機械学習技術の適用領域の拡大につながることが期待されます。現在は画像データに有効であることが確認できていますが、今後は、他の情報メディアにも応用可能にすることを目指しています。
三鼓 悠(Yuu Mitsudumi)
コミュニケーション科学基礎研究所 メディア情報研究部 メディア認識研究グループ