メディア情報研究部

[Japanese|English]

メッセージ

メディア情報研究部 部長 木村 昭悟

メディア情報研究部
部長 木村 昭悟

メディア情報研究部では、コミュニケーションにおける情報を伝達する媒体である「メディア」を対象にした情報処理技術・基礎理論に関する研究開発を推進しており、メディア認識・信号処理・事象モデリング・生体情報処理・情報基礎理論 を5つの柱としています。

「メディア」は、人と人、人とコンピュータとのコミュニケーションにおける情報を伝達する媒体であるとともに、実世界や仮想世界の様々な情報を観測したデータであると考えることもできます。この考えに基づくと、視覚や聴覚を介して観測できる音や画像のみならず、観測可能な様々なデータがメディア情報処理の対象となり得ます。

このように、私たちは、メディア情報処理のあり方をより広く捉えています。実世界計測・モデリング・信号処理・メディア認識理解・メディア生成 やそれらを支える 基礎理論・アルゴリズム など幅広い分野での専門家の経験や知識を結集することで、コミュニケーションの本質に迫り、実世界や仮想世界での暮らしを豊かにする技術の創出をめざします。

ニュース

  • 2022/10/28

    【受賞】竹内勇貴研究員が 第17回(2023年)日本物理学会若手奨励賞を受賞しました。
    業績「測定型量子計算を用いた量子超越性の実証と検証に関する理論的研究」

    https://www.jps.or.jp/activities/awards/jusyosya/wakate2023.php

  • 2022/04/22

    【受賞】竹内勇貴研究員が第5回量子ソフトウェア研究発表会にて優秀発表賞を受賞しました。
    業績「NISQ計算の分割統治による検証」

    https://www.ipsj.or.jp/award/qs-award1.html

  • 2021/03/11

    【受賞】落合 翼研究員が第16回 日本音響学会 独創研究奨励賞 板倉記念を受賞しました。
    業績「マイクロホンアレイ信号処理と音声認識の統合的最適化」

    https://acoustics.jp/awards/itakura/

  • 2021/02/18

    【受賞】亀岡 弘和上席特別研究員が 東北大学電気通信研究所 2020年度(第10 回) RIEC Award を受賞しました。
    業績「音響信号の要素分解と情景分析」

    http://www.riec.tohoku.ac.jp/ja/info/riec-award/r2/

  • 2021/01/28

    池下 林太郎研究員が第49回 日本音響学会 粟屋潔学術奨励賞を受賞しました。
    受賞論文: 池下 林太郎, 中谷 智広 "分離行列の乗算更新によるブラインド音 源分離," 日本音響学会2020年秋季研究発表会, 1-1-13, 2020.

  • 2021/01/21

    クリシュナ オンカー研究員、入江豪特別研究員、武小萌主任研究員、川西隆仁主幹研究員、柏野邦夫上席特別研究員が第26回 画像センシングシンポジウムにて、優秀学術賞を受賞しました。
    優秀学術賞 受賞論文:クリシュナ オンカー, 入江 豪, 武 小萌, 川西 隆仁, 柏野 邦夫 "適応的スポッティング:深層強化学習に基づく3D点群物体探索," 第26回 画像センシングシンポジウム, 2020.

研究グループ

研究内容

発表文献

2023

国際会議予稿

  1. Kou Tanaka, Hirokazu Kameoka, Takuhiro Kaneko & Shogo Seki (2023). Distilling sequence-to-sequence voice conversion models for streaming conversion applications. Proc. IEEE Spoken Language Technology Workshop (SLT). Doha, Qatar.

2022

論文

  1. Ken Mano, Hideki Sakurada & Yasuyuki Tsukada (2022). Quality and quantity pair as trust metric. IEICE Transactions on Information and Systems.
  2. Daisuke Niizumi, Daiki Takeuchi, Yasunori Ohishi, Noboru Harada & Kunio Kashino (2022). Masked Spectrogram Modeling using Masked Autoencoders for Learning General-purpose Audio Representations. EEE/ACM Transactions on Audio, Speech and Language Processing (TASLP).
  3. Wangyou Zhang, Xuankai Chang, Christoph Boeddeker, Tomohiro Nakatani, Shinji Watanabe & Yanmin Qian (2022). End-to-end dereverberation, beamforming, and speech recognition in a cocktail party. IEEE/ACM Transactions on Audio, Speech, and Language Processing (TASLP), 30, 3173-3188.
  4. Marc Delcroix, Jorge Bennasar Vázquez, Tsubasa Ochiai, Keisuke Kinoshita, Yasunori Ohishi & Shoko Araki (2022). Soundbeam: target sound extraction conditioned on sound-class labels and enrollment clues for increased performance and continuous learning. IEEE/ACM Transactions on Audio, Speech and Language Processing (TASLP).
  5. Kenji Ishikawa, Kohei Yatabe, Yasuhiro Oikawa, Yoshifumi Shiraki & Takehiro Moriya (2022). Speckle holographic imaging of sound field using fresnel lens. Optics Letters.
  6. Daisuke Niizumi, Daiki Takeuchi, Yasunori Ohishi, Noboru Harada & Kunio Kashino (2022). BYOL for audio: Exploring pre-trained general-purpose audio representations. IEEE/ACM Transactions on Audio Speech and Language Processing (TASLP).
  7. Daisuke Niizumi, Daiki Takeuchi, Yasunori Ohishi, Noboru Harada & Kunio Kashino (2022). Masked Spectrogram Modeling using Masked Autoencoders for Learning General-purpose Audio Representations. Proceedings of Machine Learning Research (PMLR).
  8. Li Li, Kohei Yatabe, Hirokazu Kameoka & Shoji Makino (2022). FastMVAE2: On improving and accelerating the fast variational autoencoder-based source separation algorithm for determined mixtures. IEEE/ACM Transactions on Audio, Speech and Language Processing (TASLP).
  9. X. Wu, Y. Sun, A. Kimura, and K. Kashino, "Contrast enhancement based on reflectance-oriented probabilistic equalization," Signal Processing, vol. 194, 2022.

国際会議予稿

  1. Masato Wakayama (2022). Quantum Interaction and number theory, representation theory - modular forms a bit beyond, infinite symmetric group, Fuchsian ODE. Painlevé Seminar.
  2. Yasunori Ohishi, Marc Delcroix, Tsubasa Ochiai, Shoko Araki, Daiki Takeuchi, Daisuke Niizumi, Akisato Kimura, Noboru Harada & Kunio Kashino (2022). ConceptBeam: Concept driven target speech extraction. Proc. ACM International Conference on Multimedia(ACMMM). Lisbon, Portugal.
  3. Seiya Matsuda, Akisato Kimura & Seiichi Uchida (2022). Font generation with missing impression labels. in Proc. International Conference on Pattern Recognition (ICPR). Montreal Quebec, Canada.
  4. Kana Goto, Tetsuya Ueda, Li Li, Takeshi Yamada & Shoji Makino (2022). Geometrically constrained independent vector analysis with auxiliary function approach and iterative source steering. in Proc. European Signal Processing Conference (EUSIPCO). Belgrade, Serbia.
  5. Daisuke Niizumi, Daiki Takeuchi, Yasunori Ohishi, Noboru Harada & Kunio Kashino (2022). Composing general audio representation by fusing multi-layer features of pre-trained model. in Proc. European Signal Processing Conference (EUSIPCO). Belgrade, Serbia.
  6. Natsuki Ueno & Hirokazu Kameoka (2022). Multiple sound source localization based on stochastic modeling of spatial gradient spectra. in Proc. European Signal Processing Conference (EUSIPCO). Belgrade, Serbia.
  7. Takuhiro Kaneko, Hirokazu Kameoka, Kou Tanaka & Shogo Seki (2022). MISRNet: Lightweight neural vocoder using multi-input single shared residual blocks. in Proc. Interspeech. Incheon, Korea.
  8. Hirokazu Kameoka, Takuhiro Kaneko, Shogo Seki & Kou Tanaka (2022). CAUSE: Crossmodal action unit sequence estimation from speech. in Proc. Interspeech. Incheon, Korea.
  9. Daiki Takeuchi, Yasunori Ohishi, Daisuke Niizumi, Noboru Harada & Kunio Kashino (2022). Introducing auxiliary text query-modifier to content-based audio retrieval. in Proc. Interspeech. Incheon, Korea.
  10. Takashi Shibata, Masatoshi Okutomi & Masayuki Tanaka (2022). Robustizing object detection networks using augmented feature pooling. in Proc. Asian Conference on Computer Vision (ACCV). Macau SAR, China.
  11. Yu Moriyasu, Takashi Shibata, Masayuki Tanaka & Masatoshi Okutomi (2022). Top-K ensemble for semantic segmentation robust against unexpected degradation. Proc. IEEE International Conference on Consumer Electronics(ICCE). Bordeaux,France.
  12. Yasuhiro Fujiwara, Masahiro Nakano, Atsutoshi Kumagai, Yasutoshi Ida, Akisato Kimura & Naonori Ueda (2022). Fast binary network hashing via graph clustering. Proc. IEEE BigData. Osaka, Japan.
  13. Denny Hermawanto, Kenji Ishikawa, Kohei Yatabe & Yasuhiro Oikawa (2022). Visualization of microphone's acoustic center using phase-shifting interferometry. Proc. International Congress on Acoustics (ICA). Gyeongju,Korea.
  14. M. Nakano, R. Nishikimi, Y. Fujiwara, A. Kimura, T. Yamada, and N. Ueda, "Nonparametric relational models with superrectangulation," in Proc. International Conference on Artificial Intelligence and Statistics (AISTATS), 2022.
  15. G. Irie, T. Shibata, and A. Kimura, "Co-attention-guided bilinear model for echo-based depth estimation," in Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2022.
  16. T. Kaneko, K. Tanaka, H. Kameoka, and S. Seki, "Fastening and lightening convolutional mel-spectrogram vocoder using inverse short-time fourier transform," in Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2022.
  17. S. Seki, H. Kameoka, and L. Li, "Exploring and improving multichannel variational autoencoder for underdetermined source separation," in Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2022.
  18. L. Li, H. Kameoka, and S. Seki, "HBP: An efficient block permutation solver using hungarian algorithm and spectrogram inpainting for multichannel audio source separation," in Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2022.
  19. H. Kameoka, S. Seki, L. Li, and C. Watanabe, "AttentionPIT: Soft permutation invariant training for audio source separation with attention mechanism," in Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2022.
  20. T. Kaneko, "AR-NeRF: Unsupervised learning of depth and defocus effects from natural images with aperture rendering neural radiance fields," in Proc. Conference on Computer Vision and Pattern Recognition (CVPR), 2022.
  21. S. Yoneda, G. Irie, T. Shibata, M. Nishiyama, and I. Yoshio, "Deep segmentation network without mask image supervision for 2D image registration," in Proc. International Workshop on Frontiers of Computer Vision (IW-FCV), 2022.
  22. M. Ueda, A. Kimura, and S. Uchida, "Font shape-to-impression translation," in Proc. International Workshop on Document Analysis Systems (DAS), 2022.
  23. C. Kabore, M. Tsuchida, I. Suzuki, S. Sugaya, A. Kimura, and N. Harada, "Prototyping of low-cost color enhancement lighting using multicolor LEDs," in Proc. International Symposium on Electronic Imaging (EI), 2022.

メンバー

部長

フェロー

上席特別研究員

メディア認識研究グループ

中野 允裕

中野 允裕特別研究員

藤原 靖宏

藤原 靖宏
特別研究員

三鼓 悠

三鼓 悠

信号処理研究グループ

森谷 崇史

森谷 崇史 準特別研究員

叶 高朋

叶 高朋

加茂 直之

加茂 直之

堀井 こはる

堀井 こはる

情報基礎理論研究グループ

竹内 勇貴

竹内 勇貴准特別研究員

若山 正人

若山 正人数学研究プリンシパル

秋笛 清石

秋笛 清石

色川 怜未

佐野 薫

中濱 良祐

堀永 周司

堀永 周司

宮﨑 弘安

宮﨑 弘安

Cid Reyes Bustos

Cid Reyes Bustos

事象モデリング研究グループ

Nguyen Duc Phuc

Nguyen Duc Phuc

近藤 祐斗

近藤 祐斗

竹内 大起

竹内 大起

仁泉 大輔

仁泉 大輔

生体情報処理研究グループ

佐久間 大樹

佐久間 大樹

渋江 遼平

渋江 遼平

錦見 亮

錦見 亮

所在地

Last Update: 2023/6/19