メディア情報研究部

[Japanese|English]

メッセージ

メディア情報研究部 部長 木村 昭悟

メディア情報研究部
部長 木村 昭悟

メディア情報研究部では、コミュニケーションにおける情報を伝達する媒体である「メディア」を対象にした情報処理技術・基礎理論に関する研究開発を推進しており、メディア認識・信号処理・事象モデリング・生体情報処理・情報基礎理論 を5つの柱としています。

「メディア」は、人と人、人とコンピュータとのコミュニケーションにおける情報を伝達する媒体であるとともに、実世界や仮想世界の様々な情報を観測したデータであると考えることもできます。この考えに基づくと、視覚や聴覚を介して観測できる音や画像のみならず、観測可能な様々なデータがメディア情報処理の対象となり得ます。

このように、私たちは、メディア情報処理のあり方をより広く捉えています。実世界計測・モデリング・信号処理・メディア認識理解・メディア生成 やそれらを支える 基礎理論・アルゴリズム など幅広い分野での専門家の経験や知識を結集することで、コミュニケーションの本質に迫り、実世界や仮想世界での暮らしを豊かにする技術の創出をめざします。

ニュース

  • 2023/7

    【外部採録】金子特別研究員による論文 “MIMO-NeRF: Fast Neural Rendering with Multi-input Multi-output Neural Radiance Fields” が国際会議 IEEE/CVF International Conference on Computer Vision (ICCV2023) に採録されました。
    Takuhiro Kaneko, “MIMO-NeRF: Fast Neural Rendering with Multi-Input Multi-Output Neural Radiance Fields,” IEEE/CVF International Conference on Computer Vision (ICCV2023), 2023.
    https://openaccess.thecvf.com/content/ICCV2023/html/Kaneko_MIMO-NeRF_Fast_Neural_Rendering_with_Multi-input_Multi-output_Neural_Radiance_Fields_ICCV_2023_paper.html

  • 2023/7

    【外部採録】金子特別研究員と東京大学による論文 “Frame-Level Event Representation Learning for Semantic-Level Generation and Editing of Avatar Motion” が国際会議ACM International Conference on Multimodal Interactions (ICMI)に採録されました。
    Ayaka Ideno, Takuhiro Kaneko, Tatsuya Harada, “Frame-Level Event Representation Learning for Semantic-Level Generation and Editing of Avatar Motion” ACM International Conference on Multimodal Interaction (ICMI), 2023.
    https://dl.acm.org/doi/abs/10.1145/3577190.3614175

  • 2023/7

    【外部採録】竹内准特別研究員らによる量子計算の検証の研究内容が国際会議23rd Asian Quantum Information Science Conferenceに口頭発表採録されました。
    Yuki Takeuchi, Yasuhiro Takahashi, Tomoyuki Morimae, and Seiichiro Tani , “Divide-and-conquer verification method for noisy intermediate-scale quantum computation,” Asian Quantim Information Science Conference (AQIS), 2023.
    https://doi.org/10.22331/q-2022-07-07-758

  • 2023/6

    【外部採録】原田上席特別研究員、仁泉リサーチスペシャリスト、大石担当部長、竹内研究員、安田研究員による論文 “First-shot anomaly sound detection for machine condition monitoring: A Domain Generalization baseline” が国際会議European Signal Processing Conference (EUSIPCO) に採録されました。
    Noboru Harada, Daisuke Niizumi, Yasunori Ohishi, Daiki Takeuchi, Masahiro Yasuda, “First-Shot Anomaly Sound Detection for Machine Condition Monitoring: A Domain Generalization Baseline,” European Signal Processing Conference (EUSIPCO), 2023.
    DOI:10.23919/EUSIPCO58844.2023.10289721
    https://ieeexplore.ieee.org/document/10289721

  • 2023/6

    【外部採録】関リサーチアソシエイト、亀岡上席特別研究員、金子特別研究員、田中研究主任、原田上席特別研究員による論文” W2N-AVSC: Audiovisual Extension For Whisper-To-Normal Speech Conversion”が国際会議 European Signal Processing Conference (EUSIPCO)に採録されました。
    Shogo Seki, Kanami; Imamura, Hirokazu Kameoka, Takuhiro Kaneko, Kou Tanaka, Noboru Harada, “W2N-AVSC: Audiovisual Extension For Whisper-To-Normal Speech Conversion,” European Signal Processing Conference (EUSIPCO), 2023
    DOI:10.23919/EUSIPCO58844.2023.10289823
    https://ieeexplore.ieee.org/document/10289823

  • 2023/6

    【外部採録】田中研究主任、亀岡上席特別研究員、金子特別研究員による論文”PRVAE-VC: Non-parallel many-to-many voice conversion with perturbation-resistant variational autoencoder” が国際会議 ISCA Speech Synthesis Workshop (SSW) に採録されました。
    Kou Tanaka, Hirokazu Kameoka, Takuhiro Kaneko, “PRVAE-VC: Non-parallel many-to-many voice conversion with perturbation-resistant variational autoencoder,” ISCA Speech Synthesis Workshop (SSW), 2023.
    https://www.isca-archive.org/ssw_2023/tanaka23_ssw.html
    DOI:10.21437/SSW.2023-14

  • 2023/6

    【表彰】竹内勇貴准特別研究員が情報処理学会 第85回全国大会での講演「NISQ計算の分割統治による検証」について大会優秀賞を受賞しました。
    情報処理学会第85回全国大会 (ipsj.or.jp)
    大会優秀賞-情報処理学会 (ipsj.or.jp)

  • 2023/5

    【外部採録】国際会議Interspeech2023に10本の論文が採録されました。
    ・Marc Delcroix, Naohiro Tawara, Mireia Diez, Federico Landini, Anna Silnova, Atsunori Ogawa, Tomohiro Nakatani, Lukas Burget, Shoko Araki, ” Multi-Stream Extension of Variational Bayesian HMM Clustering (MS-VBx) for Combined End-to-End and Vector Clustering-based Diarization”
    ・Naoyuki Kamo, Marc Delcroix, Tomohiro Nakatani, ” Target Speaker Extraction with Conditional Diffusion Model”
    ・Shoko Araki, Ayako Yamamoto, Tsubasa Ochiai, Kenichi Arai, Atsunori Ogawa, Tomohiro Nakatani, Toshio Irino,” Impact of Residual Noise and Artifacts in Speech Enhancement Errors on Intelligibility of Human and Machine”
    ・Hiroshi Sato, Ryo Masumura, Tsubasa Ochiai, Marc Delcroix, Takafumi Moriya, Takanori Ashihara, Kentaro Shinayama, Saki Mizuno, Mana Ihori, Tomohiro Tanaka, Nobukatsu Hojo,” Downstream Task Agnostic Speech Enhancement Conditioned on Self-Supervised Representation Loss”
    ・Takafumi Moriya, Hiroshi Sato, Tsubasa Ochiai, Marc Delcroix, Takanori Ashihara, Kohei Matsuura, Tomohiro Tanaka, Ryo Masumura, Atsunori Ogawa, Taichi Asami,” Knowledge Distillation for Neural Transducer-based Target-Speaker ASR: Exploiting Parallel Mixture/Single-Talker Speech Data”
    ・Takanori Ashihara, Takafumi Moriya, Kohei Matsuura, Tomohiro Tanaka, Yusuke Ijima, Taichi Asami, Marc Delcroix, Yukinori Honma, ” SpeechGLUE: How Well Can Self-Supervised Speech Models Capture Linguistic Knowledge?”
    ・Kohei Matsuura, Takanori Ashihara, Takafumi Moriya, Tomohiro Tanaka, Takatomo Kano, Atsunori Ogawa, Marc Delcroix, ” Transfer Learning from Pre-trained Language Models Improves End-to-End Speech Summarization”
    ・Takuhiro Kaneko, Hirokazu Kameoka, Kou Tanaka, Shogo Seki,” iSTFTNet2: Faster and More Lightweight iSTFT-Based Neural Vocoder Using 1D-2D CNN”
    ・Daisuke Niizumi, Daiki Takeuchi, Yasunori Ohishi, Noboru Harada, Kunio Kashino,” Masked Modeling Duo for Speech: Specializing General-Purpose Audio Representation to Speech using Denoising Distillation”
    ・Kou Tanaka, Takuhiro Kaneko, Hirokazu Kameoka, Shogo Seki,” CFVC: Conditional Filtering for Controllable Voice Conversion”

  • 2023/5

    【外部採録】竹内准特別研究員らによる量子鍵配送の安全性解析の研究が物理学分野の主要論文誌Physical Review Research誌に採録されました。
    Akihiro Mizutani, Yuki Takeuchi, Kiyoshi Tamaki, ”Finite-key security analysis of differential-phase-shift quantum key distribution”, Physical Review Research, 5, 023132 – Published 30 May 2023
    Phys. Rev. Research 5, 023132 (2023) - Finite-key security analysis of differential-phase-shift quantum key distribution (aps.org)

  • 2023/4

    【外部採録】藤原特別研究員と筑波大学による論文 “Uncovering the largest community in social networks at scale” が国際会議 International Joint Conference on Artificial Intelligence (IJCAI2023) に採録されました。
    Shohei Matsugu, Yasuhiro Fujiwara, Hiroaki Shiokawa, “Uncovering the Largest Community in Social Networks at Scale,” International Joint Conference on Artificial Intelligence (IJCAI2023), 2023.
    https://www.ijcai.org/proceedings/2023/0250

  • 2023/4

    【外部採録】竹内准特別研究員、谷特別研究員と三菱電機との共同研究による、量子計算機の計算能力に関する研究内容が国際会議Theory of Quantum Computation, Communication and Cryptography (TQC) に口頭発表として採録されました。
    Ryo Hiromasa, Akihiro Mizutani, Yuki Takeuchi, Seiichiro Tani, “Rewindable Quantum Computation and Its Equivalence to Cloning and Adaptive Postselection”
    https://doi.org/10.48550/arXiv.2206.05434

  • 2023/3

    【外部採録】慶應義塾大学と木村主幹研究員による論文 ”Listening human behavior: 3D human pose estimation with acoustic signals“ が国際会議 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR2023) に採録されました。
    Yuto Shibata, Yutaka Kawashima, Mariko Isogawa, Go Irie, Akisato Kimura, Yoshimitsu Aoki, “Listening human behavior: 3D human pose estimation with acoustic signals,” IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2023.
    https://openaccess.thecvf.com/content/CVPR2023/html/Shibata_Listening_Human_Behavior_3D_Human_Pose_Estimation_With_Acoustic_Signals_CVPR_2023_paper.html

  • 2023/3

    【外部採録】人間情報研究所と金子特別研究員による論文 “Unsupervised intrinsic image decomposition with LiDAR intensity” が国際会議 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR2023) に採録されました。
    Shogo Sato, Yasuhiro Yao, Taiga Yoshida, Takuhiro Kaneko, Shingo Ando, Jun Shimamura, “Unsupervised intrinsic image decomposition with LiDAR intensity,” IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2023.
    https://openaccess.thecvf.com/content/CVPR2023/html/Sato_Unsupervised_Intrinsic_Image_Decomposition_With_LiDAR_Intensity_CVPR_2023_paper.html

  • 2023/3

    【表彰】2023 AI 2000 Most Influential Scholar Honorable Mention in Speech Recognition
    中谷上席特別研究員、デルクロア特別研究員が表彰されました。
    https://www.aminer.cn/ai2000

  • 2023/2

    【外部採録】国際会議 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2023) に 9本の論文が採録されました。
    ・Xiaomeng Wu, Yongqing Sun, Akisato Kimura, “Deep quantigraphic image enhancement via comparametric equations.”
    ・Atsunori Ogawa, Takafumi Moriya, Naoyuki Kamo, Naohiro Tawara, Marc Delcroix, “Iterative shallow fusion of backward language model for end-to-end speech recognition”
    ・Takatomo Kano, Atsunori Ogawa, Marc Delcroix, Roshan Sharma, Kohei Matsuura, Shinji Watanabe, “Speech summarization of long spoken document: Improving memory efficiency of speech/text encoders”
    ・Kohei Matsuura, Takanori Ashihara, Takafumi Moriya, Tomohiro Tanaka, Atsunori Ogawa, Marc Delcroix, Ryo Masumura, “LEVERAGING LARGE TEXT CORPORA FOR END-TO-END SPEECH SUMMARIZATION”
    ・Thilo von Neumann, Christoph Boeddeker, Keisuke Kinoshita, Marc Delcroix, Reinhold Haeb-Umbach, “On Word Error Rate Definitions and their Efficient Computation for Multi-Speaker Speech Recognition Systems”
    ・Taishi Nakashima, Rintaro Ikeshita, Nobutaka Ono, Shoko Araki, Tomohiro Nakatani, ” Fast Online Source Steering Algorithm for Tracking Single Moving Source Using Online Independent Vector Analysis”
    ・Shogo Seki, Hirokazu Kameoka, Kou Tanaka, Takuhiro Kaneko, ” JSV-VC: JOINTLY TRAINED SPEAKER VERIFICATION AND VOICE CONVERSION MODELS”
    ・Daisuke Niizumi, Daiki Takeuchi, Yasunori Ohishi, Noboru Harada, Kunio Kashino,” Masked modeling duo: Learning Representations by Encouraging Both Networks to Model the Input”
    ・Takuhiro Kaneko, Hirokazu Kameoka, Kou Tanaka, Shogo Seki,” Wave-U-Net Discriminator: Fast and Lightweight Discriminator for Generative Adversarial Network-Based Speech Synthesis”

  • 2023/2

    【外部採録】武主任研究員、木村主幹研究員、柏野上席特別研究員および九州大学による Deep attentive time warping が論文誌 Pattern Recognition に採録されました。
    Shinnosuke Matsuo, Xiaomeng Wu, Guntag Atarsaikhan, Akisato Kimura, Kunio Kashino, Brian Kenji Iwana, Seiichi Uchida, “Deep attentive time warping,” Pattern Recognition, 2023.
    https://doi.org/10.1016/j.patcog.2022.109201

  • 2023/2

    【外部採録】落合研究員、デルクロア特別研究員,NTT人間情報研究所 および 東京工業大学による目的話者のE2E音声認識に関する論文がIEEE Accessに採録されました。
    T. Moriya, H. Sato, T. Ochiai, M. Delcroix and T. Shinozaki, "Streaming End-to-End Target-Speaker Automatic Speech Recognition and Activity Detection," in IEEE Access, 2023. doi: 10.1109/ACCESS.2023.3243690.
    https://ieeexplore.ieee.org/document/10041133

  • 2023/2

    【外部採録】石川研究員 および 早稲田大学による論文 “Determination of microphone acoustic center from sound field projection measured by optical interferometry” が論文誌 The Journal of the Acoustical Society of Americaに採録されました。
    Denny Hermawanto, Kenji Ishikawa, Kohei Yatabe, Yasuhiro Oikawa, “Determination of microphone acoustic center from sound field projection measured by optical interferometry,” The Journal of the Acoustical Society of America, 2023.
    https://doi.org/10.1121/10.0017246 J. Acoust. Soc. Am. 153, 1138–1146 (2023)

  • 2023/2

    【外部採録】白木主任研究員、佐藤主任研究員、守谷フェロー および 長岡技術科学大学による論文 “I/Q Demodulator based Optical Camera Communication” が論文誌IEEE Photonics Journalに採録されました。
    Hiroaki Matsunaga, Tomohiro Yendo, Wataru Kihara, Yoshifumi Shiraki, Takashi G. Sato, Takehiro Moriya, “I/Q Demodulator Based Optical Camera Communications,” IEEE Photonics Journal, 2023.
    June 2022 IEEEPhotonics Journal 14(3):1-1
    DOI:10.1109/JPHOT.2022.3166283

  • 2023/2

    【外部採録】佐藤主任研究員,白木担当課長らによる論文 “Decoding Selective Attention from EEG during Simultaneous Presentation of Two Melodies” が国際会議Neuroscience 2021に採録されました。

  • 2023/2

    【表彰】谷誠一郎特別研究員と群馬大学の高橋康博准教授(元NTTコミュニケーション科学基礎研究所)が第68回(令和4年度)の前島密賞を受賞することになりました。
    https://www.tsushinbunka.org/pdf/maejima/r04jushousha.pdf

  • 2023/1

    【外部採録】藤原特別研究員,中野主任研究員,木村主幹研究員,上田フェローおよびNTTコンピュータ&データサイエンス研究所による論文 ”Efficient Network Representation Learning via Cluster Similarity”が International Conference on Database Systems for Advanced Applications (DASFAA) に採録されました。
    Yasuhiro Fujiwara, Yasutoshi Ida, Atsutoshi Kumagai, Masahiro Nakano, Akisato Kimura, Naonori Uede, “Efficient Network Representation Learning via Cluster Similarity,” in Proc. International Conference on Database Systems for Advanced Applications (DASFAA), 2023.

  • 2023/1

    【外部採録】デルクロア特別研究員とPaderborn大学との共同研究による、会話音声の音源分離手法Graph-PITの新しい学習方法に関する論文が IEEE/ACM Transactions on Audio, Speech and Language Processing 誌に採録されました。
    T. von Neumann, K. Kinoshita, C. Boeddeker, M. Delcroix and R. Haeb-Umbach, "Segment-less Continuous Speech Separation of Meetings: Training and Evaluation Criteria," in IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2023, doi: 10.1109/TASLP.2022.3228629.
    https://ieeexplore.ieee.org/abstract/document/9982413

  • 2023/1

    【外部採録】デルクロア特別研究員、落合研究員、木下特別研究員による目的話者抽出についてのOverview論文が、IEEE Signal Processing Magazineに採録されました。
    Katerina Zmolikova, Marc Delcroix, Tsubasa Ochiai, Keisuke Kinoshita, Jan Cernocky, Dong Yu, "Neural target speech extraction: An overview," IEEE Signal Processing Magazine, 2023. DOI: 10.1109/MSP.2023.3240008.
    https://ieeexplore.ieee.org/abstract/document/10113382

  • 2023/1

    【外部採録】落合研究員、デルクロア特別研究員、中谷上席特別研究員、荒木主幹研究員による話者移動を扱えるBeamformerについての論文が、IEEE/ACM Transactions on Audio Speech and Language Processingに採録されました。
    Tsubasa Ochiai, Marc Delcroix, Tomohiro Nakatani, Shoko Araki, ”Mask-based Neural Beamforming for Moving Speakers with Self-Attention-based Tracking," IEEE/ACM Transactions onAudio Speech and Language Processing, 2023, DOI: 10.1109/TASLP.2023.3237172.
    https://ieeexplore.ieee.org/document/10017367

  • 2023/1

    【外部採録】グエン リサーチアソシエイト、白木担当課長、石川研究員、村松研究主任、原田上席特別研究員、守谷フェローによる,可視光通信のためのRegion of Interest (RoI)シグナリングにおいて低レート信号のビット列と高レート信号のビット列の出力確率を制御する2値分布マッチング手法を提案した論文が、IEEE Photonics Journalに採録されました。
    Phuc Duc Nguyen, Yoshifumi Shiraki, Kenji Ishikawa, Jun Muramatsu, Noboru Harada, Takehiro Moriya, “Distribution matching for dimming control in visible-light region-of-interest signaling,” IEEE Photonics Journal, 2023. DOI: 10.1109/JPHOT.2022.3233092

  • 2023/1

    【外部採録】柏野上席特別研究員と名古屋大学による観衆の顔向きの時空間統合による注目対象の位置及び被注目度の推定が電子情報通信学会論文誌に採録されました。
    武田一馬,川西康友,平山高嗣,出口大輔,井手一郎,村瀬洋,柏野邦夫,”観衆の顔向きの時空間統合による注目対象の位置及び被注目度の推定,” 電子情報通信学会 論文誌, J106-A, No.3, pp.58-69, 2023.
    https://search.ieice.org/bin/summary.php?id=j106-a_3_58&category=-A&year=2023&lang=J&abst=

  • 2023/1

    【表彰】俵直弘研究主任が、The 2022 IEEE Spoken Language Technology Workshop (SLT 2022) で、Best reviewer awardを受賞しました。
    https://www.slt2022.org/best-papers.php

研究グループ

研究内容

発表文献

2023

国際会議予稿

  1. Kou Tanaka, Hirokazu Kameoka, Takuhiro Kaneko & Shogo Seki (2023). Distilling sequence-to-sequence voice conversion models for streaming conversion applications. Proc. IEEE Spoken Language Technology Workshop (SLT). Doha, Qatar.

2022

論文

  1. Ken Mano, Hideki Sakurada & Yasuyuki Tsukada (2022). Quality and quantity pair as trust metric. IEICE Transactions on Information and Systems.
  2. Daisuke Niizumi, Daiki Takeuchi, Yasunori Ohishi, Noboru Harada & Kunio Kashino (2022). Masked Spectrogram Modeling using Masked Autoencoders for Learning General-purpose Audio Representations. EEE/ACM Transactions on Audio, Speech and Language Processing (TASLP).
  3. Wangyou Zhang, Xuankai Chang, Christoph Boeddeker, Tomohiro Nakatani, Shinji Watanabe & Yanmin Qian (2022). End-to-end dereverberation, beamforming, and speech recognition in a cocktail party. IEEE/ACM Transactions on Audio, Speech, and Language Processing (TASLP), 30, 3173-3188.
  4. Marc Delcroix, Jorge Bennasar Vázquez, Tsubasa Ochiai, Keisuke Kinoshita, Yasunori Ohishi & Shoko Araki (2022). Soundbeam: target sound extraction conditioned on sound-class labels and enrollment clues for increased performance and continuous learning. IEEE/ACM Transactions on Audio, Speech and Language Processing (TASLP).
  5. Kenji Ishikawa, Kohei Yatabe, Yasuhiro Oikawa, Yoshifumi Shiraki & Takehiro Moriya (2022). Speckle holographic imaging of sound field using fresnel lens. Optics Letters.
  6. Daisuke Niizumi, Daiki Takeuchi, Yasunori Ohishi, Noboru Harada & Kunio Kashino (2022). BYOL for audio: Exploring pre-trained general-purpose audio representations. IEEE/ACM Transactions on Audio Speech and Language Processing (TASLP).
  7. Daisuke Niizumi, Daiki Takeuchi, Yasunori Ohishi, Noboru Harada & Kunio Kashino (2022). Masked Spectrogram Modeling using Masked Autoencoders for Learning General-purpose Audio Representations. Proceedings of Machine Learning Research (PMLR).
  8. Li Li, Kohei Yatabe, Hirokazu Kameoka & Shoji Makino (2022). FastMVAE2: On improving and accelerating the fast variational autoencoder-based source separation algorithm for determined mixtures. IEEE/ACM Transactions on Audio, Speech and Language Processing (TASLP).
  9. X. Wu, Y. Sun, A. Kimura, and K. Kashino, "Contrast enhancement based on reflectance-oriented probabilistic equalization," Signal Processing, vol. 194, 2022.

国際会議予稿

  1. Masato Wakayama (2022). Quantum Interaction and number theory, representation theory - modular forms a bit beyond, infinite symmetric group, Fuchsian ODE. Painlevé Seminar.
  2. Yasunori Ohishi, Marc Delcroix, Tsubasa Ochiai, Shoko Araki, Daiki Takeuchi, Daisuke Niizumi, Akisato Kimura, Noboru Harada & Kunio Kashino (2022). ConceptBeam: Concept driven target speech extraction. Proc. ACM International Conference on Multimedia(ACMMM). Lisbon, Portugal.
  3. Seiya Matsuda, Akisato Kimura & Seiichi Uchida (2022). Font generation with missing impression labels. in Proc. International Conference on Pattern Recognition (ICPR). Montreal Quebec, Canada.
  4. Kana Goto, Tetsuya Ueda, Li Li, Takeshi Yamada & Shoji Makino (2022). Geometrically constrained independent vector analysis with auxiliary function approach and iterative source steering. in Proc. European Signal Processing Conference (EUSIPCO). Belgrade, Serbia.
  5. Daisuke Niizumi, Daiki Takeuchi, Yasunori Ohishi, Noboru Harada & Kunio Kashino (2022). Composing general audio representation by fusing multi-layer features of pre-trained model. in Proc. European Signal Processing Conference (EUSIPCO). Belgrade, Serbia.
  6. Natsuki Ueno & Hirokazu Kameoka (2022). Multiple sound source localization based on stochastic modeling of spatial gradient spectra. in Proc. European Signal Processing Conference (EUSIPCO). Belgrade, Serbia.
  7. Takuhiro Kaneko, Hirokazu Kameoka, Kou Tanaka & Shogo Seki (2022). MISRNet: Lightweight neural vocoder using multi-input single shared residual blocks. in Proc. Interspeech. Incheon, Korea.
  8. Hirokazu Kameoka, Takuhiro Kaneko, Shogo Seki & Kou Tanaka (2022). CAUSE: Crossmodal action unit sequence estimation from speech. in Proc. Interspeech. Incheon, Korea.
  9. Daiki Takeuchi, Yasunori Ohishi, Daisuke Niizumi, Noboru Harada & Kunio Kashino (2022). Introducing auxiliary text query-modifier to content-based audio retrieval. in Proc. Interspeech. Incheon, Korea.
  10. Takashi Shibata, Masatoshi Okutomi & Masayuki Tanaka (2022). Robustizing object detection networks using augmented feature pooling. in Proc. Asian Conference on Computer Vision (ACCV). Macau SAR, China.
  11. Yu Moriyasu, Takashi Shibata, Masayuki Tanaka & Masatoshi Okutomi (2022). Top-K ensemble for semantic segmentation robust against unexpected degradation. Proc. IEEE International Conference on Consumer Electronics(ICCE). Bordeaux,France.
  12. Yasuhiro Fujiwara, Masahiro Nakano, Atsutoshi Kumagai, Yasutoshi Ida, Akisato Kimura & Naonori Ueda (2022). Fast binary network hashing via graph clustering. Proc. IEEE BigData. Osaka, Japan.
  13. Denny Hermawanto, Kenji Ishikawa, Kohei Yatabe & Yasuhiro Oikawa (2022). Visualization of microphone's acoustic center using phase-shifting interferometry. Proc. International Congress on Acoustics (ICA). Gyeongju,Korea.
  14. M. Nakano, R. Nishikimi, Y. Fujiwara, A. Kimura, T. Yamada, and N. Ueda, "Nonparametric relational models with superrectangulation," in Proc. International Conference on Artificial Intelligence and Statistics (AISTATS), 2022.
  15. G. Irie, T. Shibata, and A. Kimura, "Co-attention-guided bilinear model for echo-based depth estimation," in Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2022.
  16. T. Kaneko, K. Tanaka, H. Kameoka, and S. Seki, "Fastening and lightening convolutional mel-spectrogram vocoder using inverse short-time fourier transform," in Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2022.
  17. S. Seki, H. Kameoka, and L. Li, "Exploring and improving multichannel variational autoencoder for underdetermined source separation," in Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2022.
  18. L. Li, H. Kameoka, and S. Seki, "HBP: An efficient block permutation solver using hungarian algorithm and spectrogram inpainting for multichannel audio source separation," in Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2022.
  19. H. Kameoka, S. Seki, L. Li, and C. Watanabe, "AttentionPIT: Soft permutation invariant training for audio source separation with attention mechanism," in Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2022.
  20. T. Kaneko, "AR-NeRF: Unsupervised learning of depth and defocus effects from natural images with aperture rendering neural radiance fields," in Proc. Conference on Computer Vision and Pattern Recognition (CVPR), 2022.
  21. S. Yoneda, G. Irie, T. Shibata, M. Nishiyama, and I. Yoshio, "Deep segmentation network without mask image supervision for 2D image registration," in Proc. International Workshop on Frontiers of Computer Vision (IW-FCV), 2022.
  22. M. Ueda, A. Kimura, and S. Uchida, "Font shape-to-impression translation," in Proc. International Workshop on Document Analysis Systems (DAS), 2022.
  23. C. Kabore, M. Tsuchida, I. Suzuki, S. Sugaya, A. Kimura, and N. Harada, "Prototyping of low-cost color enhancement lighting using multicolor LEDs," in Proc. International Symposium on Electronic Imaging (EI), 2022.

メンバー

部長

フェロー

上席特別研究員

メディア認識研究グループ

中野 允裕

中野 允裕特別研究員

藤原 靖宏

藤原 靖宏
特別研究員

三鼓 悠

三鼓 悠

信号処理研究グループ

森谷 崇史

森谷 崇史 準特別研究員

叶 高朋

叶 高朋

加茂 直之

加茂 直之

堀井 こはる

堀井 こはる

情報基礎理論研究グループ

竹内 勇貴

竹内 勇貴准特別研究員

若山 正人

若山 正人数学研究プリンシパル

秋笛 清石

秋笛 清石

色川 怜未

佐野 薫

中濱 良祐

堀永 周司

堀永 周司

宮﨑 弘安

宮﨑 弘安

Cid Reyes Bustos

Cid Reyes Bustos

事象モデリング研究グループ

近藤 祐斗

近藤 祐斗

竹内 大起

竹内 大起

仁泉 大輔

仁泉 大輔

安田 昌弘

安田 昌弘

生体情報処理研究グループ

佐久間 大樹

佐久間 大樹

渋江 遼平

渋江 遼平

白木 善史

白木 善史

錦見 亮

錦見 亮

所在地

Last Update: 2024/2/20