WWW上のみんな、オラに力を分けてくれ!
WWW上のリソースを活用した機械学習用データ作成手法
どんな研究
WWW上の多種多様、大量のデータに、WWW利用者の力を借りて機械学習用の正解ラベルを付与する仕組みを提供します。既存のWebブラウザにラベリング機能を組み込むことで簡単にラベリングできます。また、サーバと連携して様々な報酬を提供することで、利用者のラベリングを促進します。
どこが凄い
教師あり機械学習で利用する大量かつ高品質な正解ラベル付きデータを作成するには、通常膨大な人的、金銭的リソースが必要です。WWW上のデータ素材に対してWWWの利用者に自発的にラベリングしてもらうというアプローチをとることで、データの準備からラベリングまでを低コストに実現します。
めざす未来
WWW上のデータをWWWの利用者自身が整理していくことができる本技術は、いわばクラウドソーシングの新たな形態を実現します。本技術によって機械学習用の学習データを作成できるようになれば、機械学習を利用した多種多様なサービスをより安価に創出できるようになるでしょう。