メディアの科学

研究展示 21

選んで創るお気に入りの画像

~DTLC-GANを用いた画像の階層的理解・生成制御~

どんな研究

深層学習の発展により低次元データから高精細な画像を生成できるようになりつつあります。しかし、生成する際にコントロールできることは限定的で好みの画像を創ることは困難でした。本研究では属性を階層的に選びながら画像生成できる機構を考案し、この問題に対処しました。

どこが凄い

属性の階層的表現を人手で与えようとすると、詳細なラベル付けが必要で大変です。そこで、本研究では、教師データなしまたは最上位層の教師データだけで下位層の表現を自動発見できるアルゴリズムを考案しました。これにより、手間を増やすことなく高い表現力を獲得できます。

めざす未来

本技術は、深層生成モデルの代表的な一つであるGANの自然な拡張であり、画像生成だけにとどまらず、音声などの他のメディアデータの生成への応用も期待されます。また、得られた階層的表現は生成だけではなく、検索・編集・変換などの他タスクで活用することも可能です。

関連文献

  • [1] T. Kaneko, K. Hiramatsu, K. Kashino, “Generative Attribute Controller with Conditional Filtered Generative Adversarial Networks,” in Proc. The 30th IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2017.
    [2] T. Kaneko, K. Hiramatsu, K. Kashino, “Generative Adversarial Image Synthesis with Decision Tree Latent Controller,” in Proc. The 31st IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2018 (to appear).

ポスター

アイコンをクリックすると、展示ポスターのPDFが開きます。
PDFの表示にはAdobe Acrobat Reader等のPDF閲覧表示が必要です。

当日の様子

展示代表者

金子 卓弘
金子 卓弘
メディア情報研究部