低い誤検知率で異常を検知
部分AUC最大化のための半教師あり学習
どんな研究
機械学習における二値分類問題において、ラベルなしデータを活用することによって、部分AUC(偽陽性率が特定の範囲での真陽性率)を高める分類器の学習方法に関する研究です。例えば異常検知において、誤検知率を低く抑えた状態で真の異常を見逃さなくすることが可能になります。
どこが凄い
従来技術ではラベルなしデータを活用することができませんでした。私たちはラベルありデータとラベルなしデータを用いて近似的な部分AUCを計算する方法を考案しました。そして、その近似部分AUCを最大化させるように分類器を学習することによって、高精度の分類を可能にしました。
めざす未来
本技術を用いることで、コストが高いラベルを付ける作業を減らしても高い分類性能を達成することができます。これまで少数の学習データしか得られない場合には機械学習技術を適用できませんでしたが、本技術を発展させることにより、機械学習の適用範囲を広げることをめざします。