メディア認識研究グループ｜NTTコミュニケーション科学基礎研究所

2025

国際会議予稿

Shogo Sato, Takuhiro Kaneko, Kazuhiko Murasaki, Taiga Yoshida, Ryuichi Tanida & Akisato Kimura (2025). Unsupervised Single-Image Intrinsic Image Decomposition with LiDAR Intensity Enhanced Training. 2025 IEEE/CVF Winter Conference on Applications of Computer Vision (WACV). Los Alamitos, CA, USA.

2024

論文

Yu Mitsuzumi, Go Irie, Akisato Kimura & Atsushi Nakazawa (2024). Phase Randomization: A Data Augmentation for Domain Adaptation in Human Action Recognition. Pattern Recognition, 146.

国際会議予稿

Yu Mitsuzumi, Akisato Kimura, Go Irie & Atsushi Nakazawa (2024). Cross-Action Cross-Subject Skeleton Action Recognition Via Simultaneous Action-Subject Learning With Two-Step Feature Removal. 2024 IEEE International Conference on Image Processing (ICIP). Abu Dhabi, United Arab Emirates.
Yusuke Oumi, Yuto Shibata, Go Irie, Akisato Kimura, Yoshimitsu Aoki & Mariko Isogawa (2024). Acoustic-Based 3D Human Pose Estimation Robust to Human Position. 35th British Machine Vision Conference 2024,(BMVC). Glasgow, UK.
Yasuhiro Fujiwara, Atsutoshi Kumagai, Yasutoshi Ida, Masahiro Nakano, Makoto Nakatsuji & Akisato Kimura (2024). Efficient Algorithm for K-Multiple-Means. ACM SIGMOD International Conference on Management of Data. Santiago, Chile.
Yasunori Ohishi, Marc Delcroix, Tsubasa Ochiai, Shoko Araki, Daiki Takeuchi, Daisuke Niizumi, Akisato Kimura, Noboru Harada & Kunio Kashino (2024). Target Speech Spotting and Extraction Based on ConceptBeam. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). Seoul, Korea.
Takuhiro kaneko (2024). Improving Physics Augmented Continuum Neural Radiance Fileds-Based Geometry-Agnostic System Identification with Lagrangian Particle Optimization. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Seattle, WA, USA.
Yu Mitsuzumi, Akisato Kimura & Hisashi Kashima (2024). Understanding and Improving Source-free Domain Adaptation from a Theoretical Perspective. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Seattle, USA.

2023

論文

Shinnosuke Matsuo, Xiaomeng Wu, Gantugs Atarsaikhan, Akisato Kimura, Kunio Kashino, Brian Kenji Iwana & Seiichi Uchida (2023). Deep attentive time warping. Pattern Recogntiion, 136.
Yasuhiro Fujiwara, Yasutoshi Ida, Atsutoshi Kumagai, Masahiro Nakano, Akisato Kimura & Naonori Ueda (2023). Efficient Network Representation Learning via Cluster Similarity. Data Science and Engineering, 8, 279-291.
Naoki Chihara, Tadafumi Takata, Yasuhiro Fujiwara, Koki Noda, Keisuke Toyoda, Kaito Higuchi & Makoto Onizuka (2023). Effective Detection of Variable Celestial Objects Using Machine Learning-based Periodic Analysis. Astronomy and Computing, 45.

国際会議予稿

Yasuhiro Fujiwara, Yasutoshi Ida, Atsutoshi Kumagai, Masahiro Nakano, Akisato Kimura & Naonori Ueda (2023). Efficient Network Representation Learning via Cluster Similarity. Proc. International Conference on Database Systems for Advanced Applications (DASFAA). Tianjin, China.
Xiaomeng Wu, Yongqing Sun & Akisato Kimura (2023). Deep Quantigraphic Image Enhancement via Comparametric Equations. Proc. IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP). island of Rhodes,Greek.
Yuto Shibata, Yutaka Kawashima, Mariko Isogawa, Go Irie, Akisato Kimura & Yoshimitsu Aoki (2023). Listening Human Behavior: 3D Human Pose Estimation with Acoustic Signals. Proc. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Vancouver, Canada.
Shogo Sato, Yasuhiro Yao, Taiga Yoshida, Takuhiro Kaneko, Shingo Ando & Jun Shimamura (2023). Unsupervised Intrinsic Image Decomposition with LiDAR Intensity. Proc. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Vancouver, Canada.
Shohei Matsugu, Yasuhiro Fujiwara & Hiroaki Shiokawa (2023). Uncovering the Largest Community in Social Networks at Scale. Proc. International Joint Conference on Artificial Intelligence (IJCAI). Cape Town, South Africa.
Takuhiro Kaneko (2023). MIMO-NeRF: Fast Neural Rendering with Multi-input Multi-output Neural Radiance Fields. Proc. IEEE/CVF International Conference on Computer Vision (ICCV). Paris, France.
Ayaka Ideno, Takuhiro Kaneko & Tatsuya Harada (2023). Frame-Level Event Representation Learning for Semantic-Level Generation and Editing of Avatar Motion. Proc. ACM International Conference on Multimodal Interaction (ICMI). Paris, France.
Rentaro Kataoka, Akisato Kimura & Seiichi Uchida (2023). Towards defensive letter design. Proc. Asian Conference on Pattern Recognition (ACPR). Kitakyushu, Japan.
Hayato Mitani, Akisato Kimura & Seiichi Uchida (2023). Selective scene text removal. Proc. British Machine Vision Conference (BMVC). Aberdeen, Britain.

2022

論文

X. Wu, Y. Sun, A. Kimura, and K. Kashino, "Contrast enhancement based on reflectance-oriented probabilistic equalization," Signal Processing, vol. 194, 2022.

国際会議予稿

Seiya Matsuda, Akisato Kimura & Seiichi Uchida (2022). Font generation with missing impression labels. in Proc. International Conference on Pattern Recognition (ICPR). Montreal Quebec, Canada.
Kana Goto, Tetsuya Ueda, Li Li, Takeshi Yamada & Shoji Makino (2022). Geometrically constrained independent vector analysis with auxiliary function approach and iterative source steering. in Proc. European Signal Processing Conference (EUSIPCO). Belgrade, Serbia.
Daisuke Niizumi, Daiki Takeuchi, Yasunori Ohishi, Noboru Harada & Kunio Kashino (2022). Composing general audio representation by fusing multi-layer features of pre-trained model. in Proc. European Signal Processing Conference (EUSIPCO). Belgrade, Serbia.
Natsuki Ueno & Hirokazu Kameoka (2022). Multiple sound source localization based on stochastic modeling of spatial gradient spectra. in Proc. European Signal Processing Conference (EUSIPCO). Belgrade, Serbia.
Takuhiro Kaneko, Hirokazu Kameoka, Kou Tanaka & Shogo Seki (2022). MISRNet: Lightweight neural vocoder using multi-input single shared residual blocks. in Proc. Interspeech. Incheon, Korea.
Hirokazu Kameoka, Takuhiro Kaneko, Shogo Seki & Kou Tanaka (2022). CAUSE: Crossmodal action unit sequence estimation from speech. in Proc. Interspeech. Incheon, Korea.
Daiki Takeuchi, Yasunori Ohishi, Daisuke Niizumi, Noboru Harada & Kunio Kashino (2022). Introducing auxiliary text query-modifier to content-based audio retrieval. in Proc. Interspeech. Incheon, Korea.
Takashi Shibata, Masatoshi Okutomi & Masayuki Tanaka (2022). Robustizing object detection networks using augmented feature pooling. in Proc. Asian Conference on Computer Vision (ACCV). Macau SAR, China.
Yasunori Ohishi, Marc Delcroix, Tsubasa Ochiai, Shoko Araki, Daiki Takeuchi, Daisuke Niizumi, Akisato Kimura, Noboru Harada & Kunio Kashino (2022). ConceptBeam: Concept driven target speech extraction. Proc. ACM International Conference on Multimedia(ACMMM). Lisbon, Portugal.
Yu Moriyasu, Takashi Shibata, Masayuki Tanaka & Masatoshi Okutomi (2022). Top-K ensemble for semantic segmentation robust against unexpected degradation. Proc. IEEE International Conference on Consumer Electronics(ICCE). Bordeaux,France.
Yasuhiro Fujiwara, Masahiro Nakano, Atsutoshi Kumagai, Yasutoshi Ida, Akisato Kimura & Naonori Ueda (2022). Fast binary network hashing via graph clustering. Proc. IEEE BigData. Osaka, Japan.
M. Nakano, R. Nishikimi, Y. Fujiwara, A. Kimura, T. Yamada, and N. Ueda, "Nonparametric relational models with superrectangulation," in Proc. International Conference on Artificial Intelligence and Statistics (AISTATS), 2022.
G. Irie, T. Shibata, and A. Kimura, "Co-attention-guided bilinear model for echo-based depth estimation," in Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2022.
T. Kaneko, K. Tanaka, H. Kameoka, and S. Seki, "Fastening and lightening convolutional mel-spectrogram vocoder using inverse short-time fourier transform," in Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2022.
S. Seki, H. Kameoka, and L. Li, "Exploring and improving multichannel variational autoencoder for underdetermined source separation," in Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2022.
L. Li, H. Kameoka, and S. Seki, "HBP: An efficient block permutation solver using hungarian algorithm and spectrogram inpainting for multichannel audio source separation," in Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2022.
H. Kameoka, S. Seki, L. Li, and C. Watanabe, "AttentionPIT: Soft permutation invariant training for audio source separation with attention mechanism," in Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2022.
T. Kaneko, "AR-NeRF: Unsupervised learning of depth and defocus effects from natural images with aperture rendering neural radiance fields," in Proc. Conference on Computer Vision and Pattern Recognition (CVPR), 2022.
S. Yoneda, G. Irie, T. Shibata, M. Nishiyama, and I. Yoshio, "Deep segmentation network without mask image supervision for 2D image registration," in Proc. International Workshop on Frontiers of Computer Vision (IW-FCV), 2022.
M. Ueda, A. Kimura, and S. Uchida, "Font shape-to-impression translation," in Proc. International Workshop on Document Analysis Systems (DAS), 2022.
C. Kabore, M. Tsuchida, I. Suzuki, S. Sugaya, A. Kimura, and N. Harada, "Prototyping of low-cost color enhancement lighting using multicolor LEDs," in Proc. International Symposium on Electronic Imaging (EI), 2022.

2021

論文

M. Tsuchida, A. Kimura, and M. Harada, "Color saturation control by modulating spectral power distribution of illumination using color enhancement factors," Electronic Imaging, vol. 30, 2021.
S. Yoneda, K. Ueno, G. Irie, M. Nishiyama, and Y. Iwai, "Joint object recognition and pose estimation using multiple-anchor triplet learning of canonical plane," Pattern Recognition Letters, vol. 152, pp. 372-381, 2021.
T. Nakamura and H. Kameoka, "Harmonic-Temporal Factor Decomposition for Unsupervised Monaural Separation of Harmonic Sounds," IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2021, vol. 29, pp. 68-82.
H. Kameoka, W. -C. Huang, K. Tanaka, T. Kaneko, N. Hojo, and T. Toda, "Many-to-Many Voice Transformer Network," IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2021, vol. 29, pp. 656-670.
W. -C. Huang, T. Hayashi, Y. -C. Wu, H. Kameoka, and T. Toda, "Pretraining Techniques for Sequence-to-Sequence Voice Conversion," IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2021, vol. 29, pp. 745-755.
C. Watanabe and H. Kameoka, "X-DC: Explainable Deep Clustering based on Learnable Spectrogram Templates," Neural Computation, (Volume 33, Issue 7), 2021.
Y. Fujiwara, S. Kanai, Y. Ida, A. Kumagai, and N. Ueda, "Fast Algorithm for Anchor Graph Hashing," Very Large Data Base (VLDB) Endowment Inc., 2021, vol. 14, no. 6, pp.916-928.
X. Wu, Y.Sun, T. Kawanishi, and K. Kashino, "Contrast Enhancement based on Discriminative Co-occurrence Statistics," Multimedia Tools and Applications, 80(4), 2021, pp. 6413-6442.
Xiaomeng Wu, Takahito Kawanishi, Kunio Kashino, "Reflectance-guided histogram equalization and comparametric approximation," IEEE Transactions on Circuits and Systems for Video Technology 31(3): 863-876 (2021).

国際会議予稿

O. Krishna, G. Irie, X. Wu, A. Kimura, and K. Kashino, "Deep reinforcement image matching with self-termination," in Proc. International Conference on Image Processing (ICIP), 2021.
N. Wanchaitanawong, M. Tanaka, T. Shibata, and M. Okutomi, "Multi-modal pedestrian detection with large misalignment based on modal-wise regression and multi-modal IoU," in Proc. International Conference on Machine Vision Applications (MVA), 2021.
Y. Fujiwara, Y. Ida, A. Kumagai, S. Kanai, and N. Ueda, "Fast and accurate anchor graph-based label prediction," in Proc. International Conference on Information and Knowledge Management (CIKM), 2021.
S. Seki, H. Taga, and T. Toda, "Singing fundamental frequency contour generation using generalized command- response model and score-conditional variational autoencoder," in Proc. International Workshop on Machine Learning for Signal Processing (MLSP), 2021.
Y. Kawaguchi, K. Imto, Y. Koizumi, N. Harada, D. Niizumi, K. Dohi, R. Tanabe, H. Purohit, and T. Endo, "Description and discussion on DCASE 2021 challenge task 2: Unsupervised anomalous sound detection for machine condition monitoring under domain shifted conditions," Detection and Classification of Acoustic Scenes and Events (DCASE) Challenge, Tech. Rep., 2021.
M. Nakano, Y. Fujiwara, A. Kimura, T. Yamada, and N. Ueda, "Bayesian nonparametric model for arbitrary cubic partitioning," in Proc. Asian Conference on Machine Learning (ACML), 2021.
M. Nakano, Y. Fujiwara, A. Kimura, T. Yamada, and N. Ueda, "Permuton-induced Chinese restaurant process," in Proc. Conference on Neural Information Processing Systems (NeurIPS), 2021.
T. Kaneko, "(Invited) Image synthesis and voice conversion using generative adversarial networks," in Proc. International Display Workshops, 2021.
J. Kang, D. Haraguchi, S. Matsuda, A. Kimura, and S. Uchida, "Shared latent space of font shapes and their noisy impressions," in Proc. International Conference on Multimedia Modeling (MMM), 2022.
X. Li, R. Furuta, G. Irie, and Y. Taniguchi, "Accurate indoor localization using multi-view image distance," in Proc. International Conference on Image Electronics and Visual Computing (IEVC), 2021.
Q. Yu, D. Ikami, G. Irie, and K. Aizawa, "Self-labeling framework for novel category discovery over domains," in Proc. Conference on Artificial Intelligence (AAAI), 2021.
N. Murashima, H. Kameoka, L. Li, S. Seki, and S. Makino, "Single-channel muti-speaker separation via discriminative training of variational autoencoder spectrogram model," in Proc. RISP International Workshop on Nonlinear Circuits, Communi cations and Signal Processing (NCSP), 2021.
Y. Ohishi, Y. Tanaka, and K. Kashino, "Unsupervised Co-Segmentation for Athlete Movements and Live Commentaries Using Crossmodal Temporal Proximity," in Proc. the 25th International Conference on Pattern Recognition (ICPR), 2021, pp. 9137-9142.
D. Ikami, G. Irie, and T. Shibata, "Constrained Weight Optimization for Learning without Activation Normalization," in Proc. the IEEE/CVF Winter Conference on Applications of Computer Vision (WACV), 2021, pp. 2606-2614.
Y. Fujiwara, Y. Ida, S. Kanai, A. Kumagai, and N. Ueda, "Fast Similarity Computation for t-SNE," in Proc. the 37th IEEE International Conference on Data Engineering (ICDE), 2021.
S. Inoue, H. Kameoka, L. Li, and S. Makino, "SepNet: A Deep Separation Matrix Prediction Network for Multichannel Audio Source Separation," in Proc. 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2021, pp. 191-195.
X. Wu, Y. Sun, A. Kimura, and K. Kashino, "Reflectance-Oriented Probabilistic Equalization for Image Enhancement," in Proc. 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2021, pp. 1835-1839.
T. Kaneko, H. Kameoka, K. Tanaka, and N. Hojo, "MaskCycleGAN-VC: Learning Non-Parallel Voice Conversion with Filling in Frames," In Proc. 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2021, pp. 5919-5923.
Y. Mitsuzumi, G. Irie, D. Ikami, and T. Shibata, "Generalized Domain Adaptation," in Proc. the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2021.
T. Kaneko, "Unsupervised Learning of Depth and Depth-of-Field Effect from Natural Images with Aperture Rendering Generative Adversarial Networks," in Proc. the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2021.
D. Niizumi, D. Takeuchi, Y. Ohishi, N. Harada, and K. Kashino, "BYOL for Audio: Self-Supervised Learning for General-Purpose Audio Representation," in Proc. the International Joint Conference on Neural Networks (IJCNN), 2021.
Shinnosuke Matsuo, Xiaomeng Wu, Gantugs Atarsaikhan, Akisato Kimura, Kunio Kashino, Brian Kenji Iwana, and Seiichi Uchida, "Attention to warp: Deep metric learning for multivariate time series," IEEE International Conference on Document Analysis and Recognition (ICDAR) 2021.
T. Shibata, G. Irie, D. Ikami, and Y. Mitsuzumi, "Learning with Selective Forgetting" in Proc. International Joint Conference on Artificial Intelligence (IJCAI2021), August 2021.
T. Shibata, M. Tanaka and M. Okutomi, "Geometric Data Augmentation Based on Feature Map Ensemble" in Proc. IEEE International Conference on Image Processing (ICIP2021), September 2021.
Seiya Matsuda, Akisato Kimura, Seiichi Uchida, "Impression2Font: Generating fonts by specifying impressions," in Proc. International Conference on Document Analysis and Recognition (ICDAR), 2021.
Masaya Ueda, Akisato Kimura, Seiichi Uchida, "Which parts determine the impression of fonts?" in Proc. International Conference on Document Analysis and Recognition (ICDAR), 2021.

2020

論文

X. Wu, T. Kawanishi, and K. Kashino, "Reflectance-guided histogram equalization and comparametric approximation," IEEE Transactions on Circuits and Systems for Video Technology, 2020.
北条伸克, 井島勇祐, 杉山弘晃, 宮崎昇, 川西隆仁, 柏野邦夫, 対話行為情報を表現可能なDNN音声合成と発語内行為自然性に関する評価, 人工知能学会論文誌, 2020, 35 巻, 2 号, p. A-J81_1-17.
C. Watanabe, K. Hiramatsu, and K. Kashino, "Knowledge discovery from layered neural networks based on non-negative task matrix decomposition," IEICE Transactions on Information and Systems, vol. E103.D, no. 2, pp. 390-397, 2020.
I. Takahashi, N. Suzuki, N. Yasuda, A. Kimura, N. Ueda, M. Tanaka, N. Tominaga, and N. Yoshida, "Photometric Classification of Hyper Suprime-Cam Transients using Machine Learning," Publications of the Astronomical Society of Japan, no. 5, vol. 72, 2020.
H. Kameoka, T. Kaneko, K. Tanaka, and N. Hojo, "Nonparallel Voice Conversion with Augmented Classifier Star Generative Adversarial Networks," IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2020, vol 28, pp. 2982-2995.

国際会議予稿

N. Hojo, Y. Ijima, H. Sugiyama, N. Miyazaki, T. Kawanishi, and K. Kashino, "DNN-based speech synthesis considering dialogue-act information and its evaluation with respect to illocutionary act naturalness," in Proc. the 10th International Conference on Speech Prosody (Speech Prosody 2020), 2020.
D. Takeuchi, K. Yatabe, Y. Koizumi, Y. Oikawa, and N. Harada, "Invertible DNN-based nonlinear time-frequency transform for speech enhancement," in Proc. ICASSP 2020 - 2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2020, pp. 6644-6648.
Y. Ohishi, A. Kimura, T. Kawanishi, K. Kashino, D. Harwath, and J. Glass, "Trilingual semantic embeddings of visually grounded speech with self-attention mechanisms," in Proc. ICASSP 2020 - 2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2020, pp. 4352-4356.
X. Wu, T. Kawanishi, and K. Kashino, "Reflectance-guided, contrast-accumulated histogram equalization," in Proc. ICASSP 2020 - 2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2020, pp. 2498-2502.
S. Kurihara, M. Fukui, S. Shimauchi, and N. Harada, "Subjective quality estimation using PESQ for hands-free terminals," in Proc. ICASSP 2020 - 2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2020, pp. 921-925.
D. Takeuchi, K. Yatabe, Y. Koizumi, Y. Oikawa, and N. Harada, "Real-time speech enhancement using equilibriated RNN," in Proc. ICASSP 2020 - 2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2020, pp. 851-855.
Y. Masuyama, K. Yatabe, Y. Koizumi, Y. Oikawa, and N. Harada, "Phase reconstruction based on recurrent phase unwrapping with deep neural networks," in Proc. ICASSP 2020 - 2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2020, pp. 826-830.
Y. Koizumi, M. Yasuda, S. Murata, S. Saito, H. Uematsu, and N. Harada, "SPIDERnet: Attention network for one-shot anomaly detection in sounds," in Proc. ICASSP 2020 - 2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2020, pp. 281-285.
S. Emura, H. Sawada, S. Araki, and N. Harada, "A frequency-domain BSS method based on l1 norm, unitary constraint, and cayley transform," in Proc. ICASSP 2020 - 2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2020, pp. 111-115.
L. Li, H. Kameoka, and S. Makino, "Determined Audio Source Separation with Multichannel Star Generative Adversarial Network," in Proc. the 30th International Workshop on Machine Learning for Signal Processing (MLSP), 2020, pp. 1-6.
H. Takeuchi, K. Kashino, Y. Ohishi, and H. Saruwatari, "Harmonic Lowering for Accelerating Harmonic Convolution for Audio Signals," in Proc. the 21th Annual Conference of the International Speech Communication Association (Interspeech), 2020, pp. 185-189.
M. Yasuda, Y. Ohishi, Y. Koizumi, and N. Harada, "Crossmodal Sound Retrieval based on Specific Target Co-occurrence Denoted with Weak Labels," in Proc. the 21th Annual Conference of the International Speech Communication Association (Interspeech), 2020, pp. 1446-1450.
Y. Ohishi, A. Kimura, T. Kawanishi, K. Kashino, D. Harwath, and J. Glass, "Pair Expansion for Learning Multilingual Semantic Embeddings Using Disjoint Visually-Grounded Speech Audio Datasets," in Proc. the 21th Annual Conference of the International Speech Communication Association (Interspeech), 2020, pp. 1486-1490.
T. Kaneko, H. Kameoka, K. Tanaka, and N. Hojo, "CycleGAN-VC3: Examining and Improving CycleGAN-VCs for Mel-Spectrogram Conversion," in Proc. the 21th Annual Conference of the International Speech Communication Association (Interspeech), 2020, pp. 2017-2021.
W. Huang, T. Hayashi, Y. Wu, H. Kameoka, and T. Toda, "Voice Transformer Network: Sequence-to-Sequence Voice Conversion Using Transformer with Text-to-Speech Pretraining," in Proc. the 21th Annual Conference of the International Speech Communication Association (Interspeech), 2020, pp. 4676-4680.
D. Takeuchi, Y. Koizumi, Y. Ohishi, N. Harada, and K. Kashino, "Effects of Word-frequency based Pre- and Post- Processings for Audio Captioning," in Proc. the fifth workshop on Detection and Classification of Acoustic Scenes and Events (DCASE), 2020.
Y. Fujiwara, A. Kumagai S. Kanai, Y. Ida, and N. Ueda, "Efficient Algorithm for the b-Matching Graph," in Proc. the 26th Conference on Knowledge Discovery and Data Mining (ACM SIGKDD), 2020, pp. 187-197.
O. Krishna, G. Irie, X. Wu, T. Kawanishi, and K. Kashino, "Adaptive Spotting: Deep Reinforcement Object Search in 3D Point Clouds," in Proc. the Asian Conference on Computer Vision (ACCV), 2020.
G. Irie, D. Ikami, T. Kawanishi, and K. Kashino, "Cascaded Transposed Long-range Convolutions for Monocular Depth Estimation," in Proc. the Asian Conference on Computer Vision (ACCV), 2020.
M. Nakano, A. Kimura, T. Yamada, and N. Ueda, "Baxter Permutation Process," in Proc. Advances in Neural Information Processing Systems (NeurIPS), vol.33, 2020, pp. 8648-8659.
Xiaomeng Wu, Akisato Kimura, Kunio Kashino, Seiichi Uchida, "Total whitening for online signature verification based on deep representation," International Conference on Pattern Recognition (ICPR) 2020: 655-661
Y. Mitsuzum, G. Irie, A. Kimura and A. Nakazawa, "A Generative Self-Ensemble Approach To Simulated+Unsupervised Learning," in Proc ICIP2020 - 2020 IEEE International Conference on Image Processing (ICIP), 2020, pp. 2151-2155.

2019

論文

S. Seki, H. Kameoka, L. Li, T. Toda, and K. Takeda, "Underdetermined source separation based on generalized multichannel variational autoencoder," IEEE Access, vol. 7, pp. 168104-168115, 2019.
H. Kameoka, T. Kaneko, K. Tanaka, and N. Hojo, "ACVAE-VC: Non-parallel voice conversion with auxiliary classifier variational autoencoder," IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol. 27, no. 9, pp. 1432-1443, 2019.
H. Kameoka, L. Li, S. Inoue, and S. Makino, "Supervised determined source separation with multichannel variational autoencoder," Neural Computation, vol. 31, pp. 1-24, 2019.
C. Watanabe, K. Hiramatsu, and K. Kashino, "Understanding community structure in layered neural networks," Neurocomputing, vol. 367, pp. 84-102, 2019.
金井関利，藤原靖宏，岩村相哲，足立修一， "Gated recurrent unitの局所安定化による勾配爆発の抑制"，電子情報通信学会論文誌D, Vol.J102-D, No.8, pp.530-541, 2019.

国際会議予稿

C. Watanabe, "Interpreting layered neural networks via hierarchical modular representation," in Proc. ICONIP 2019 - the 26th International Conference on Neural Information Processing, 2019, pp. 376-388.
M. Yamaguchi, G. Irie, T. Kawanishi, and K. Kashino, "Subspace structure-aware spectral clustering for robust subspace clustering," in Proc. ICCV 2019 - 2019 IEEE/CVF International Conference on Computer Vision (ICCV), 2019, pp. 9874-9883.
S. Ikawa and K. Kashino, "Neural audio captioning based on conditional sequence-to-sequence model," in Proc. DCASE 2019 - the Detection and Classification of Acoustic Scenes and Events 2019 Workshop (DCASE), 2019, pp. 99-103.
M. Tsuchida, H. Gunji, H. Nakajima, T. Kawanishi, K. Kashino, and A. Matsui, "Development of the stool color card for early detection of biliary atresia using multispectral image," in Proc. CIC 2019 - the 27th Color and Imaging Conference, 2019, pp. 304-307.
X. Wu, A. Kimura, B. K. Iwana, S. Uchida, and K. Kashino, "Deep dynamic time warping: End-to-end local representation learning for online signature verification," in Proc. ICDAR 2019 - International Conference on Document Analysis and Recognition (ICDAR), 2019, pp. 1103-1110.
K. Ueno, G. Irie, M. Nishiyama, and Y. Iwai, "Weakly supervised triplet learning of canonical plane transformation for joint object recognition and pose estimation," in Proc. ICIP 2019 - 2019 IEEE International Conference on Image Processing (ICIP), 2019, pp. 2476-2480.
G. Irie, T. Kawanishi, and K. Kashino, "Robust learning for deep monocular depth estimation," in Proc. ICIP 2019 - 2019 IEEE International Conference on Image Processing (ICIP), 2019, pp. 964-968.
N. Hojo and N. Miyazaki, "Evaluating intention communication by TTS using explicit definitions of illocutionary act performance," in Proc. Interspeech 2019 - the 20th Annual Conference of the International Speech Communication Association, 2019, pp. 1536-1540.
T. Kaneko, H. Kameoka, K. Tanaka, and N. Hojo, "StarGAN-VC2: Rethinking conditional methods for StarGAN-based voice conversion," in Proc. Interspeech 2019 - the 20th Annual Conference of the International Speech Communication Association, 2019, pp. 679-683.
S. Inoue, H. Kameoka, L. Li, S. Seki, and S. Makino, "Joint separation, dereverberation and classification of multiple sources using multichannel variational autoencoder with auxiliary classifier," in Proc. ICA 2019 - the 23rd International Congress on Acoustics (ICA), 2019, pp. 6988-6995.
M. Yamaguchi, G. Irie, T. Kawanishi, and K. Kashino, "Delving deep into least square regression model for subspace clustering," in Proc. BMVC 2019 - the 30th British Machine Vision Conference, 2019, p. 118.
S. Seki, H. Kameoka, L. Li, T. Toda, and K. Takeda, "Generalized multichannel variational autoencoder for underdetermined source separation," in Proc. EUSIPCO 2019 - the 27th European Signal Processing Conference (EUSIPCO), 2019, pp. 1-5.
M. Tsuchida and H. Sato, S. Imamura, T. Kawanishi, K. Kashino, and K. Yano, "Giga-pixel multispectral imaging using commercially available digital camera," in Proc. CIDOC 2019 - 2019 International Committee for Documentation Annual Conference (CIDOC), 2019.
M. Tsuchida, T. Kawanishi, and K. Kashino, "Virtual color restoration of decolored object using spectrally programmable light source," in Proc. CIDOC 2019 - 2019 International Committee for Documentation Annual Conference (CIDOC), 2019.
M. Tsuchida and H. Sato, T. Kawanishi, K. Kashino, and K. Yano, "High resolution image retrieval, browsing and visual guide system for museum using smartphone," in Proc. CIDOC 2019 - 2019 International Committee for Documentation Annual Conference (CIDOC), 2019.
T. Kaneko, H. Kameoka, K. Tanaka, and N. Hojo, "Cycleganvc2: Improved cyclegan-based non-parallel voice conversion," in Proc. ICASSP 2019 - 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2019, pp. 6820-6824.
K. Tanaka, H. Kameoka, T. Kaneko, and N. Hojo, "ATTS2S-VC: Sequence-to-sequence voice conversion with attention and context preservation mechanisms," in Proc. ICASSP 2019 - 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2019, pp. 6805-6809.
G. Irie, M. Ostrek, H. Wang, H. Kameoka, A. Kimura, T. Kawanishi, and K. Kashino, "Seeing through sounds: Predicting visual semantic segmentation results from multichannel audio signals," in Proc. ICASSP 2019 - 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2019, pp. 3961-3964.
M. Yamaguchi, Y. Koizumi, and N. Harada, "Adaflow: Domain-adaptive density estimator with application to anomaly detection and unpaired cross-domain translation," in Proc. ICASSP 2019 - 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2019, pp. 3647-3651.
X. Wu, A. Kimura, S. Uchida, and K. Kashino, "Prewarping siamese network: Learning local representations for online signature verification," in Proc. ICASSP 2019 - 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2019, pp. 2467-2471.
O. Krishna, G. Irie, X. Wu, T. Kawanishi, and K. Kashino, "Learning search path for region-level image matching," in Proc. ICASSP 2019 - 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2019, pp. 1967-1971.
L. Li, H. Kameoka, and S. Makino, "Fast MVAE: Joint separation and classification of mixed sources based on multichannel variational autoencoder with auxiliary classifier," in Proc. ICASSP 2019 - 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2019, pp. 546-550.
S. Inoue, H. Kameoka, L. Li, S. Seki, and S. Makino, "Joint separation and dereverberation of reverberant mixtures with multichannel variational autoencoder," in Proc. ICASSP 2019 - 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2019, pp. 96-100.
Y. Ida, Y. Fujiwara, "Network implosion: Effective model compression for ResNets via static layer pruning and retraining," in Proc. IJCNN 2019 - 2019 International Joint Conference on Neural Networks (IJCNN), 2019, pp. 1-8.
A. Kumagai, T. Iwata, Y. Fujiwara, "Transfer metric learning for unseen domains" in Proc. ICDM 2019 - 2019 International Conference on Data Mining (ICDM), 2019, pp. 2467-2477.
Y. Fujiwara, Y. Ida, S. Kanai, A. Kumagai, J. Arai, N. Ueda, "Fast random forest algorithm via incremental upper bound," in Proc. CIKM 2019 - 2019 ACM International Conference on Information and Knowledge Management (CIKM), 2019, pp. 2205-2208.
A. Kumagai, T. Iwata, Y. Fujiwara, "Transfer anomaly detection by inferring latent domain representations," In Proc. NeurIPS 2019 - 2019 Annual Conference on Neural Information Processing Systems (NeurIPS), 2019, pp. 2467-2477.
Y. Ida, Y. Fujiwara, H. Kashima, "Fast sparse group lasso," in Proc. NeurIPS 2019 - 2019 Annual Conference on Neural Information Processing Systems (NeurIPS), 2019, pp. 1700-1708.
S. Kanai, Y. Ida, Y. Fujiwara, M. Yamada, S. Adachi, "Absum: Simple regularization method for reducing structural sensitivity of convolutional neural networks," in Proc. AAAI 2020 - 2020 AAAI Conference on Artificial Intelligence, 2020.
M. Eshghi, K. Tanaka, K. Kobayashi, H. Kameoka, T. Toda, "An investigation of features for fundamental frequency pattern prediction in electrolaryngeal speech enhancement," in Proc. the 10th ISCA Speech Synthesis Workshop (SSW2019), 2019, pp. 251-256.
D. Wang, H. Kameoka, K. Shinoda, "A modified algorithm for multiple input spectrogram inversion," in Proc. Interspeech 2019 - the 20th Annual Conference of the International Speech Communication Association, 2019, pp. 4569-4573.

2018

論文

H. Kameoka, T. Higuchi, M. Tanaka, L. Li, "Nonnegative matrix factorization with basis clustering using cepstral distance regularization," IEEE/ACM Transactions on Audio, Speech and Language Processing, vol. 26, no. 6, pp. 1029-1040, Jun. 2018.
C. Watanabe, K. Hiramatsu, and K. Kashino "Modular Representation of Layered Neural Networks," Neural Networks, vol. 97, pp. 62-73, 2018.
X. Wu, K. Hiramatsu, and K. Kashino, "Label propagation with ensemble of pairwise geometric relations: Towards robust large-scale retrieval of object instances," International Journal of Computer Vision, vol. 126, no. 7, pp. 689-713, 2018.
田中亜実, 西橋毅, 坂本裕哉, 末松怜大, 川西隆仁, 道関隆国 "ハブ発電機とFM/AM受信機を用いたタイムスタンプ機能付き自転車用バッテリレススピードレコーダ," 電気学会論文誌Ｅ（センサ・マイクロマシン部門誌）, 2018, 138 巻, 3 号, pp. 79-86.

国際会議予稿

K. Tanaka, T. Kaneko, N. Hojo, and H. Kameoka, "Synthetic-to-natural speech waveform conversion using cycle-consistent adversarial networks," in Proc. SLT 2018 - IEEE Spoken Language Technology Workshop (SLT), 2018, pp. 632-639.
H. Kameoka, T. Kaneko, K. Tanaka, and N. Hojo, "StarGAN-VC: Non-parallel many-to-many voice conversion using star generative adversarial networks," in Proc. SLT 2018 - IEEE Spoken Language Technology Workshop (SLT), 2018, pp. 266-273.
M. Tsuchida, T. Kawanishi, and K. Kashino, "Color enhancement factors to control spectral power distribution of illumination," in Proc. SIGGRAPH Asia 2018 Posters, 2018.
Y. Kodama, Y. Kawanishi, T. Hirayama, D. Deguchi, I. Ide, H. Murase, H. Nagano, and K. Kashino, "Localizing the gaze target of a crowd of people," Computer Vision - ACCV 2018 Workshops-14th Asian Conference on Computer Vision, Perth, Australia, December 2-6, 2018, Revised Selected Papers, pp. 15-30, Springer LNCS 11367, June 2019.
S. Ikawa and K. Kashino, "Acoustic event search with an onomatopoeic query: measuring distance between onomatopoeic words and sound," in Proc. DCASE 2018 - the Detection and Classification of Acoustic Scenes and Events (DCASE), 2018.
X. Wu, G. Irie, K. Hiramatsu, and K. Kashino, "Weighted generalized mean pooling for deep image retrieval," in Proc. ICIP 2018 - the 25th IEEE International Conference on Image Processing (ICIP), 2018, pp. 495-499.
M. Mori and M. Nakano, "Efficient cyclic learning rate schedules and their evaluations for neural network ensemble," in Proc. MLSP 2018 - the 28th IEEE International Workshop on Machine Learning for Signal Processing (MLSP), 2018, pp. 1-6.
K. Oyamada, H. Kameoka, T. Kaneko, K. Tanaka, N. Hojo, and H. Ando, "Generative adversarial network-based approach to signal reconstruction from magnitude spectrogram," in Proc. EUSIPCO 2018 - the 26th European Signal Processing Conference (EUSIPCO), 2018, pp. 2514-2518.
N. Hojo, H. Kameoka, K. Tanaka, and T. Kaneko, "Automatic speech pronunciation correction with dynamic frequency warping-based spectral conversion," in Proc. EUSIPCO 2018 - the 26th European Signal Processing Conference (EUSIPCO), 2018, pp. 2310-2314.
T. Kaneko and H. Kameoka, "CycleGAN-VC: Non-parallel voice conversion using cycle-consistent adversarial networks," in Proc. EUSIPCO 2018 - the 26th European Signal Processing Conference (EUSIPCO), 2018, pp. 2100-2104.
A. Kimura, Z. Ghahramani, K. Takeuchi, T. Iwata, and N. Ueda, "Few-shot learning of neural networks from scratch by pseudo example optimization," in Proc. BMVC 2018 - the British Machine Vision Conference (BMVC), 2018.
K. Yano, M. Tsuchida, S. Imamura, and M. Yamaji, "WebGIS-based application for compering rakuchu rakugai-zu folding screens," in Proc. DSDAH 2018 - the 1st KDD Workshop on Data Science for Digital Art History: tackling big data Challenges, Algorithms, and Systems (DSDAH), 2018.
B. K. Iwana, M. Mori, A. Kimura, and S. Uchida, "Introducing local distance-based features to temporal convolutional neural networks," in Proc. ICFHR 2018 - the 16th International Conference on Frontiers in Handwriting Recognition (ICFHR), 2018, pp. 92-97.
T. Kaneko, K. Hiramatsu, and K. Kashino, "Generative adversarial image synthesis with decision tree latent controller," in Proc. CVPR 2018 - IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2018, pp. 6606-6615.
K. Tanaka, H. Kameoka, and K. Morikawa, "VAE-SPACE: Deep generative model of voice fundamental frequency contours," in Proc. ICASSP 2018 - 2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2018, pp. 5779-5783.
L. Juvela, B. Bollepalli, X. Wang, H. Kameoka, M. Airaksinen, J. Yamagishi, and P. Alku, "Speech waveform synthesis from MFCC sequences with generative adversarial networks," in Proc. ICASSP 2018 - 2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2018, pp. 5679-5683.
R. Sato, H. Kameoka and K. Kashino, "Statistical phrase/accent command estimation algorithm utilizing linguistic information," in Proc. ICASSP 2018 - 2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2018, pp. 5569-5573.
X. Wu, G. Irie, K. Hiramatsu, and K. Kashino, "Query expansion with diffusion on mutual rank graphs," in Proc. ICASSP 2018 - 2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2018, pp. 1653-1657.
S. Ikawa and K. Kashino, "Generating sound words from audio signals of acoustic events with sequence-to-sequence model," in Proc. ICASSP 2018 - 2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2018, pp. 346-350.
H. Kagami, H. Kameoka, and M. Yukawa, "Joint separation and dereverberation of reverberant mixtures with determined multichannel non-negative matrix factorization," in Proc. ICASSP 2018 - 2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2018, pp. 31-35.
L. Li and H. Kameoka, "Deep clustering with gated convolutional networks," in Proc. ICASSP 2018 - 2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2018, pp. 16-20.
Y. Mukuta, A. Kimura, D. Adrian, and Z. Ghahramani "Weakly supervised collective feature learning from curated media," in Proc. AAAI 2018 - the 32nd AAAI Conference on Artificial Intelligence (AAAI), 2018, pp. 7260-7267.

2017

論文

F. Wang, H. Nagano, K. Kashino and T. Igarashi, "Visualizing Video Sounds with Sound Word Animation to Enrich User Experience", IEEE Transactions on Multimedia, vol. 19, no. 2, pp. 418-429, Feb. 2017.

国際会議予稿

P. L. Tobing, H. Kameoka, and T. Toda, "Deep acoustic-toarticulatory inversion mapping with latent trajectory modeling," in Proc. 2017 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), 2017, pp. 1274-1277.
K. Oyamada, H. Kameoka, T. Kaneko, H. Ando, K. Hiramatsu, and K. Kashino, "Non-native speech conversion with consistency-aware recursive network and generative adversarial network," in Proc. 2017 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), 2017, pp. 182-188.
C. Watanabe, K. Hiramatsu, and K. Kashino, "Modular representation of autoencoder networks," in Proc. SSCI - IEEE Symposium Series on Computational Intelligence (SSCI), 2017, pp. 1-8.
C. Watanabe, K. Hiramatsu, and K. Kashino, "Recursive extraction of modular structure from layered neural networks using variational Bayes method," in Proc. Discovery Science, 2017, pp. 207-222.
L. Li, H. Kameoka, and S. Makino, "Mel-generalized cepstral regularization for discriminative non-negative matrix factorization," in Proc. MLSP 2017 - IEEE 27th International Workshop on Machine Learning for Signal Processing (MLSP), 2017, pp. 1-6.
S. Seki, H. Kameoka, T. Toda, and K. Takeda, "Missing component restoration for masked speech signals based on time-domain spectrogram factorization," in Proc. MLSP 2017 - IEEE 27th International Workshop on Machine Learning for Signal Processing (MLSP), 2017, pp. 1-6.
X. Wu, X. Liu, K. Hiramatsu, and K. Kashino, "Contrast-accumulated histogram equalization for image enhancement," in Proc. ICIP 2017 - 2017 IEEE International Conference on Image Processing (ICIP), 2017, pp. 3190-3194.
T. Kaneko, S. Takaki, H. Kameoka, and J. Yamagishi, "Generative adversarial network-based postfilter for STFT spectrograms," in Proc. Interspeech 2017 - the 18th Annual Conference of the International Speech Communication Association, 2017, pp. 3389-3393.
L. Li, H. Kameoka, T. Toda, and S. Makino, "Speech enhancement using non-negative spectrogram models with Mel-generalized cepstral regularization," in Proc. Interspeech 2017 - the 18th Annual Conference of the International Speech Communication Association, 2017, pp. 1998-2002.
S. Takaki, H. Kameoka, and J. Yamagishi, "Direct modeling of frequency spectra and waveform generation based on phase recovery for DNN-based speech synthesis," in Proc. Interspeech 2017 - the 18th Annual Conference of the International Speech Communication Association, 2017, pp. 1128-1132.
T. Kaneko, H. Kameoka, K. Hiramatsu, and K. Kashino, "Sequence-to-sequence voice conversion with similarity metric learned using generative adversarial networks," in Proc. Interspeech 2017 - the 18th Annual Conference of the International Speech Communication Association, 2017, pp. 1283-1287.
K. Tanaka, H. Kameoka, T. Toda, and S. Nakamura, "Physically constrained statistical F0 prediction for electrolaryngeal speech enhancement," in Proc. Interspeech 2017 - the 18th Annual Conference of the International Speech Communication Association, 2017, pp. 1069-1073.
M. Murata, K. Hiramatsu, and S. Satoh, "Information retrieval model using generalized Pareto distribution and its application to instance search," in Proc. SIGIR 2017 - the 40th International ACM SIGIR Conference on Research and Development in Information Retrieval, 2017, p. 1117-1120.
M. Nakano, "Infinite number place," in Proc. the 11th conference on Bayesian Nonparametrics, 2017, p. 46.
A. Kimura, I. Takahashi, M. Tanaka, N. Yasuda, N. Ueda, and N. Yoshida, "Single-epoch supernova classification with deep convolutional neural networks," in Proc. ICDCSW 2017 - IEEE 37th International Conference on Distributed Computing Systems Workshops (ICDCSW), 2017, pp. 354-359.
R. Sato, H. Kameoka, and K. Kashino, "Fast algorithm for statistical phrase/accent command estimation based on generative model incorporating spectral features," in Proc. ICASSP 2017 - 2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2017, pp. 5595-5599.
Y. Tajiri, H. Kameoka, T. Toda, and S. Nakamura, "A noise suppression method for body-conducted soft speech based on non-negative tensor factorization of air- and body- conducted signals," in Proc. ICASSP 2017 - 2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2017, pp. 4960-4964.
T. Kaneko, H. Kameoka, N. Hojo, Y. Ijima, K. Hiramatsu, and K. Kashino, "Generative adversarial network-based postfilter for statistical parametric speech synthesis," in Proc. ICASSP 2017 - 2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2017, pp. 4910-4914.
X. Wu, T. Kawanishi, M. Mori, K. Hiramatsu, and K. Kashino, "Edited film alignment via selective Hough transform and accurate template matching," in Proc. ICASSP 2017 - 2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2017, pp. 1707-1711.
X. Liu, T. Kawanishi, X. Wu, K. Hiramatsu, and K. Kashino, "Deep salience map guided arbitrary direction scene text recognition," in Proc. ICASSP 2017 - 2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2017, pp. 1642-1646.
H. Kagami, H. Kameoka, and M. Yukawa, "A majorization-minimization algorithm with projected gradient updates for time-domain spectrogram factorization," in Proc. ICASSP 2017 - 2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2017, pp. 561-565.
H. Kameoka, H. Kagami, and M. Yukawa, "Complex NMF with the generalized Kullback-Leibler divergence," in Proc. ICASSP 2017 - 2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2017, pp. 56-60.
M. Tsuchida, K. Yano, K. Hiramatsu, and K. Kashino, "Visualizing lost designs in degraded early modern tapestry using infra-red image," in Proc. the 6th Computational Color Imaging Workshop (CCIW'17), Springer LNCS vol. 10213, 2017, pp.144-149.
L. Li, H. Kameoka, and S. Makino, "Discriminative non-negative matrix factorization with majorization-minimization," in Proc. HSCMA 2017 - the 5th Joint Workshop on Hands-free Speech Communication and Microphone Arrays, 2017, pp. 141-145.
Y. Hirose, A. Kimura, and H. Fujishiro, "Cleansing, organizing and training: Two guidelines for generating attractive news headlines for social media," Computation + Journalism Symposium (C+J2017), 2017.
T. Kaneko, K. Hiramatsu, and K. Kashino, "Generative attribute controller with conditional filtered generative adversarial networks," in Proc. CVPR 2017 - the 30th IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2017, pp. 6089-6098.

招待講演

T. Kaneko, K. Hiramatsu, and K. Kashino, "【招待講演】Generative attribute controller with conditional filtered generative adversarial networks (CVPR2017)," 第20回画像の認識・理解シンポジウム (MIRU 2017), 2017年8月10日.
亀岡弘和, 小野順貴, 猿渡洋, "音響分野におけるブラインド適応信号処理の展開," 2017年電子情報通信学会総合大会, 2017年3月24日.

2016

論文

Masaya Murata, Hidehisa Nagano, Kaoru Hiramatsu, Kunio Kashino and Shin'ichi Satoh, ``Bayesian Exponential Inverse Document Frequency and Region-of-Interest Effect for Enhancing Instance Search Accuracy'', IEICE Transactions on Information and Systems, vol. E99-D, no. 9, pp. 2320-2331, Sep. 2016.
Daichi Kitamura, Nobutaka Ono, Hiroshi Sawada, Hirokazu Kameoka, Hiroshi Saruwatari, “Determined blind source separation unifying independent vector analysis and nonnegative matrix factorization,” IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol. 24, no. 9, pp. 1626-1641, Sep. 2016.
若山涼至，木村昭悟，山下隆義，山内悠嗣，藤吉弘亘, "共変量シフト適応に基づくrandom forestsの並列分散学習," 電子情報通信学会論文誌，Vol.99-D，No.8, August 2016．
興梠紗和, 木村昭悟, 藤代裕之, 西川仁, “SNS上で拡散するwebニュース説明文の調査と自動選択,” 電子情報通信学会論文誌 D-II, vol. J99-D, No.4, pp.403-414, 2016.4
K. O’Hanlon, H. Nagano, N. Keriven and M. D.Plumbley, “Non-Negative Group Sparsity with Subspace Note Modeling for Polyphonic Transcription,” IEEE/ACM Transactions on Audio, Speech, and Language Processing, Vol.24, no.3, pp.530-542, Mar. 2016.
Xiaomeng Wu, Jun Shimamura, Taiga Yoshida, Hidehisa Nagano, Kunio Kashino, Takahito Kawanishi, Kaoru Hiramatsu, Takayuki Koizumi, Testuya Kinebuchi, “Spatial Verification via Pairwise Geometric Constraints and 3D View-Directional Voting,” ITE Transaction on Media Technology and Applications, 2016.

書籍、解説記事

北原鉄朗, 永野秀尚編, "特集「音楽を軸に拡がる情報科学」", 情報処理, pp. 504--543, vol. 57, no. 6, 2016.
Takehiro Moriya, Ryosuke Sugiura, Yutaka Kamamoto, Hirokazu Kameoka and Noboru Harada, ``Progress in LPC-based frequency-domain audio coding,'' APSIPA Transactions on Signal and Information Processing, 2016.
Hirokazu Kameoka, "Non-negative matrix factorization and its variants for audio signal processing," in Applied Matrix and Tensor Variate Data Analysis, T. Sakata (Ed.), Springer Japan, Feb. 2016.
永野秀尚, “ビブリオ・トーク‐私のオススメ‐「理科系の作文技術」,” 情報処理 pp.188-189, vol.57, no. 2, 2016
木村昭悟 "映像の知覚的顕著性に基づく視覚的注意の予測" 日本光学会誌特集「視覚における注意の仕組みとその産業応用」，Vol.45, No.1, pp.22-28, 2016年1月
矢野経済研究所　Yano E plus 2016年1月号（No. 094）「次世代市場トレンド：高色再現ディスプレイ技術動向」※ 取材に基づいた解説が掲載（pp. 87-89）

招待講演

木村昭悟 "メディア理解の多重性とその解消に向けて" to appear, 電子情報通信学会パターン認識・メディア理解研究会, 鳥取県鳥取市, 2016年12月
Hirokazu Kameoka, Hideaki Kagami, "Complex non-negative matrix factorization: Phase-aware sparse representation of audio spectrograms," 5th Joint Meeting of the Acoustical Society of America and the Acoustical Society of Japan, 2016年11月29日.
木村昭悟 "膨大なメディアデータの認識・探索と活用" 東京大学ソーシャルICTグローバルクリエイティブリーダ育成プログラム Global Design Seminer，東京都文京区，2016年11月
木村昭悟 "多変量解析の一般化とそのメディア認識への応用" 科研費基盤(B)「一般化差分部分空間に基づく特徴抽出の完全解明と機能強化」ワークショップ「部分空間法・深層学習・大型固有値問題の出会いと融合」，茨城県つくば市，2016年9月
亀岡弘和, "統計的音響信号処理," NLP若手の会(YANS)第11回シンポジウム, 2016年8月28日.
中野允裕, "圏論と無限データ解析," 5回 NetSci/CCS 研究会, 2016年8月9日
亀岡弘和, "音響信号の分解と再構成," 第19回画像の認識・理解シンポジウム(MIRU2016), 2016年8月3日.
亀岡弘和, "音響信号の分解と再構成," 情報処理学会音学シンポジウム2016, 2016年5月21日.

国際会議予稿

Xinhao Liu, Takahito Kawanishi, Xiaomeng Wu, Kunio Kashino: Scene text recognition with CNN classifier and WFST-based word labeling. International Conference on Pattern Recognition (ICPR) 2016
Aki Hayashi, Hirokazu Kameoka, Tatsushi Matsubayashi, Hiroshi Sawada, "Non-negative periodic component analysis for music source separation," in Proc. Asia Pacific Signal and Information Processing Association Annual Summit and Conference 2016 (APSIPA ASC 2016), Dec. 2016.
Nobutaka Ono, Kazuaki Shibata, Hirokazu Kameoka, "Self-localization and channel synchronization of smartphone arrays using sound emissions," in Proc. Asia Pacific Signal and Information Processing Association Annual Summit and Conference 2016 (APSIPA ASC 2016), Dec. 2016.
Masaru Tsuchida, Kaoru Hiramatsu, and Kunio Kashino, “Designing Spectral Power Distribution of Illumination with Color Chart to Enhance Color Saturation”, 24th Color and Imaging conference (CIC24), pp. 278-282, Nov., 2016
Shuya Ito, Koichi Ito, Takafumi Aoki, and Masaru Tsuchida, A 3D Reconstruction Method with Color Reproduction from Multi-band and Multi-view Images, ACCV 2016 Workshop (e-heritage), Springer LNCS vol. 10117, pp 236-247, Nov., 2016
Takuhiro Kaneko, Kaoru Hiramatsu, Kunio Kashino, "Adaptive Visual Feedback Generation for Facial Expression Improvement with Multi-task Deep Neural Networks", The 24th ACM International Conference on Multimedia (ACMMM), Amsterdam, The Netherlands, October 2016.
Kota Nagayama, Akisato Kimura, Hiroyuki Fujishiro "Make it go viral - Generating attractive headlines for distributing news articles on social media," Proc. Computation + Journalism Symposium (C+J2016), Stanford, CA, USA, September-October 2016.
Li Li, Hirokazu Kameoka, Takuya Higuchi, Hiroshi Saruwatari, "Semi-supervised joint enhancement of spectral and cepstral sequences of noisy speech," in Proc. The 17th Annual Conference of the International Speech Communication Association (Interspeech 2016), pp. 3753-3757, Sep. 2016.
Patrick Lumban Tobing, Tomoki Toda, Hirokazu Kameoka, Satoshi Nakamura, "Acoustic-to-articulatory inversion mapping based on latent trajectory Gaussian mixture model," in Proc. The 17th Annual Conference of the International Speech Communication Association (Interspeech 2016), pp. 953-957, Sep. 2016.
Lauri Juvela, Hirokazu Kameoka, Manu Airaksinen, Junichi Yamagishi, Paavo Alku, "Majorisation-minimisation based optimisation of the composite autoregressive system with application to glottal inverse filtering," in Proc. The 17th Annual Conference of the International Speech Communication Association (Interspeech 2016), pp. 968-972, Sep. 2016.
Naoki Murata, Hirokazu Kameoka, Keisuke Kinoshita, Shoko Araki, Tomohiro Nakatani, Shoichi Koyama, Hiroshi Saruwatari, "Reverberation-robust underdetermined source separation with non-negative tensor double deconvolution," in Proc. 2016 24th European Signal Processing Conference (EUSIPCO 2016), pp. 1648-1652, Aug. 2016.
Masaya Murata, Hidehisa Nagano, Kaoru Hiramatsu and Kunio Kashino, "Filter Design based on Multiple Model Estimation", The 2016 American Control Conference (ACC 2016), pp. 7061-7066, Jul. 2016.
Kou Tanaka, Hirokazu Kameoka, Tomoki Toda, Satoshi Nakamura, “Statistical F0 prediction for electrolaryngeal speech enhancement considering generative process of F0 contours within product of experts framework,” in Proc. 2016 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2016), Mar. 2016.
Tomohiko Nakamura, Hirokazu Kameoka, “Shifted non-negative matrix factorization with source-filter model for monaural audio source separation,” in Proc. 2016 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2016), Mar. 2016.
Xinhao liu, Takahito Kawanishi, Xiaomeng Wu, Kunio Kashino, “Scene Text recognition with high performance CNN classifier and efficient word inference,”2016 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2016), Mar. 2016
Naoki Murata, Shoichi Koyama, Hirokazu Kameoka, Norihiro Takamune, Hiroshi Saruwatari, “Sparse sound field decomposition with multichannel extension of complex NMF,” in Proc. 2016 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2016), Mar. 2016
Katsushiko Ishiguro, Issei Sato, Naonori Ueda, Masahiro Nakano, Akisato Kimura "Infinite plaid models for infinite bi-clustering," Proc. Internationa AAAI Conference on Artificial Intelligence (AAAI2016), February 2016.

その他会議予稿

Xinhao Liu, Takahito Kawanishi, Xiaomeng Wu, Kunio Kashino: Scene text recognition with CNN classifier and WFST-based word labeling. 画像の認識・理解シンポジウム, 2016
佐藤遼太郎, 亀岡弘和, 柏野邦夫, "基本周波数パターンと音韻特徴量系列の同時生成モデルによる韻律指令列推定," 電子情報通信学会技術研究報告, Dec. 2016.
金子卓弘, 亀岡弘和, 北条伸克, 井島勇祐, 平松薫, 柏野邦夫, "統計的パラメトリック音声合成のための敵対的学習に基づくポストフィルタリング," 電子情報通信学会技術研究報告, Dec. 2016.
高木信二, SangJin Kim, 亀岡弘和, 山岸順一, "DNNに基づくテキスト音声合成のためのFFTスペクトルを用いた位相復元に基づく音声波形生成," 電子情報通信学会技術研究報告, Dec. 2016.
中野允裕，渡邊千紘，木村昭悟，平松薫．組み合わせ論的拘束を持つ確率過程の構成．情報論的学習理論ワークショップ(IBIS2016), 京都府京都市，2016年11月．
渡邊千紘，中野允裕，武小萌，川西隆仁，平松薫，柏野邦夫．有限の直径を持つ無限グラフ．情報論的学習理論ワークショップ(IBIS2016), 京都府京都市，2016年11月．
鏡英章, 亀岡弘和, 湯川正裕, "Iダイバージェンス規準複素NMF," 日本音響学会2016年秋季研究発表会講演論文集, 1-P-5, pp. 433-436, Sep. 2016.
岸田拓也, 亀岡弘和, 中島祥好, "トラジェクトリ隠れマルコフモデルによる音声強調," 日本音響学会2016年秋季研究発表会講演論文集, 3-5-2, pp. 151-154, Sep. 2016.
村田隆英，木村昭悟，牛久祥孝，山下隆義，山内悠嗣，藤吉弘亘 "Efficient online parallel training of random forests based on Mondrian forests" 画像の認識・理解シンポジウム (MIRU2016) ，静岡県浜松市，2016年8月
李莉, 亀岡弘和, 樋口卓哉, 猿渡洋, 牧野昭二, "音声のスペクトル領域とケプストラム領域における同時強調," 電子情報通信学会技術研究報告, Aug. 2016.
ルンバントビン・パトリック, 戸田智基, 亀岡弘和, 中村哲, “潜在トラジェクトリ混合正規分布モデルによる調音運動逆推定の検討,” 日本音響学会 2016 春季研究発表会講演論文集,1-2-8, pp.227-228, Mar. 2016.
田尻祐介, 亀岡弘和, 戸田智基, 中村哲, “空気／体内伝導信号の非負値テンソル分解に基づく体内伝導微弱音声に対する雑音抑圧法,” 日本音響学会 2016 春季研究発表会講演論文集,1-3-4, pp.557-558, Mar. 2016.
李莉, 亀岡弘和, 樋口卓哉, 猿渡洋, “ケプストラム距離正則化半教師ありNMFによる音声強調,” 日本音響学会 2016 春季研究発表会講演論文集,1-P-27, pp.721-724, Mar. 2016.
田中宏, 亀岡弘和, 戸田智基, 中村哲, “F0パターン生成過程を考慮したProduct-of-Expertsに基づく電気音声強調のための統計的F0予測法,” 日本音響学会 2016 春季研究発表会講演論文集,2-2-13, pp.259-260, Mar. 2016.
中村友彦, 亀岡弘和, “高速近似連続ウェーブレット変換による振幅スペクトログラムに対する実時間位相推定法,” 日本音響学会 2016 春季研究発表会講演論文集,2-10-12, pp.933-936, Mar. 2016.
鈴木惇, 亀岡弘和, “波源拘束差分方程式に基づく音響信号の確率モデル化と複数音源定位アルゴリズム,” 日本音響学会 2016 春季研究発表会講演論文集,3-3-4, pp.615-618, Mar. 2016.
村田直毅, 亀岡弘和, 木下慶介, 荒木章子, 中谷智広, 小山翔一, 猿渡洋, “非負値テンソル二重逆畳み込みによる残響環境下の劣決定音源分離,” 日本音響学会 2016 春季研究発表会講演論文集,3-3-6, pp.623-626, Mar. 2016.
林亜紀, 亀岡弘和, 松林達史, 澤田宏, “非負値周期成分分析法による音楽音響信号の音源分離,” 日本音響学会 2016 春季研究発表会講演論文集,3-3-12, pp.639-642, Mar. 2016.
中村友彦, 亀岡弘和, “非負値行列因子分解に基づく欠損データ補間による声道スペクトル推定法の検討,” 日本音響学会 2016 春季研究発表会講演論文集,3-P-33, pp.393-396, Mar. 2016.
中村友彦, 亀岡弘和, “非負値行列因子分解を用いた欠損データ補間による超解像声道スペクトル推定,” 電子情報通信学会技術研究報告, Mar. 2016.
Patrick Lumban Tobing, Tomoki Toda, Hirokazu Kameoka, Satoshi Nakamura, “An evaluation of acoustic-to-articulatory inversion mapping with latent trajectory Gaussian mixture model,” 電子情報通信学会技術報告, Mar. 2016.
田尻祐介, 亀岡弘和, 戸田智基, “中村哲, 空気／体内伝導信号の非負値テンソル分解に基づく体内伝導微弱音声に対する雑音抑圧法,” 電子情報通信学会技術報告, Mar. 2016.
Lauri Juvela, Hirokazu Kameoka, Junichi Ymagishi, “Majorisation-minimization based composite autoregressive system optimization with a glottal source moderlprior,” 電子情報通信学会技術報告, Mar. 2016.
田中宏, 亀岡弘和, 戸田智基, 中村哲, “電気音声強調のための統計的F0予測におけるProduct-of-ExpertsによるF0パターン生成過程モデルの導入,” 電子情報通信学会技術報告, Mar. 2016.
村田隆英，木村昭悟，牛久祥孝，山下隆義，山内悠嗣，藤吉弘亘 "教師あり学習の導入によるMondrian Forestsの効率化" 電子情報通信学会技術報告，PRMU2015-000，東京都江東区，2016年3月
藤田早苗，木村昭悟，服部正嗣，小林哲生，奥村優子 "絵本のレビュー解析と画像特徴量による直感に沿った画像評価" 言語処理学会全国大会予稿集，宮城県仙台市，2016年3月
永山孝太，木村昭悟，藤代裕之 "SNS上での拡散を考慮したニュース記事中重要文の自動選択," データ工学と情報マネジメントに関するフォーラム (DEIM2016) 予稿集，福島県郡山市，2016年3月．

2015

論文

Xiaomeng Wu, Kunio Kashino: Interest point selection by topology coherence for multi-query image retrieval. Multimedia Tools and Applications 74(17): 7147-7180 (2015)
亀岡弘和, 鎌本優, 杉浦亮介, “スパース表現に基づく音声音響符号化” 日本音響学会誌, vol.68, no.11, pp.559-565, Nov, 2015.
Xiaomeng Wu, Kunio Kashino, “Second-Order Configuration of Local Features for Geometrically Stable Image Matching and Retrieval,” IEEE Transactions on Circuits and System for Video Technology, Vol.25, no.8, PP.1395-1408, 2015.
木村昭悟, 石黒勝彦, Alejandro Marcos Alvarez, 山田誠, 片岡香織, 村崎和彦, “ソーシャルキュレーションデータを用いた画像コンテクストマイニング,” 論文誌, 情報処理学会論文誌数理モデル化と応用（TOM）,Vol.8, no.5, pp.1882-7780, 2015.11

書籍、解説記事

Hirokazu Kameoka, “Non-negative matrix factorization and its variants for audio signal processing,” in Applied Matrix and Tensor Variate Data Analysis, T.Sakata (Ed.), Springer Japan, 2015.
藤代裕之 [編著]，一戸信哉，山口浩，五十嵐悠紀，生貝直人，伊藤儀雄，小笠原伸，木村昭悟，工藤郁子，小林啓倫，新志有裕，西田亮介 [著] "ソーシャルメディア論 - つながりを再設計する" 青弓社，2015年
木村昭悟, “画像メディアとSNS,” 人工知能学辞典, 人工知能学会
亀岡弘和, “ 音楽信号解析音響キーワードブック”, コロナ社
佐藤真一, 永野秀尚,“小特集「画像認識革命」編集にあたって,” 情報処理学会誌　Vol.56, No.7, pp.622-623, 2015年7月．
木村昭悟, "ソーシャルネットワークが変える画像の認識・理解" 情報処理学会誌小特集「画像認識革命」，Vol.56, No.7, pp.646-651, 2015年7月．
永野秀尚, 小特集「画像認識革命」編集室,” 情報処理学会誌, Vol.56, No.7, pp.626-627, 2015年7月.
平松薫, “2016年全国大会に向けて,”（巻頭言）, 人工知能, 2015年11月

招待講演

木村昭悟 "大規模マルチメディア解析コーパスとしてのソーシャルキュレーションの可能性" 第15回Kフォーラム，岐阜県高山市，2015年8月
Masahiro Nakano, Katsuhiko Ishiguro, Akisato Kimura, Takeshi Yamada, Naonori Ueda "Rectangular tiling process," 画像の認識・理解シンポジウム (MIRU2015)，大阪府吹田市，2015年7月.
Akisato Kimura "Computation models of human visual attention driven by auditory cues," International Symposium on Brainware LSI, Sendai, Miyagi, Japan, March 2015.

国際会議予稿

M. Murata, H. Nagano, and K. Kashino, “Gaussian Unscented Filter,” The 54th IEEEConference on Decision and Control (CDC 2015), pp. 4338-4343, Dec. 2015.
X. Wu, T yoshida, J. Shimamura, H. Nagano, K. Kashino, T. Kawanishi, K. Hiramatsu, T. Kurozumi and T. Kinebuchi, “NTT at TRECVID 2015: Instance Search,” Proc. Of TRECVID 2015, Nov. 2015.
M. Tsuchida, M. Mori, K. Kashino, and J. Ymamoto, “Reproduction of Reflective and Fluorescent Components using Eight-band Imaging,” 23rd Color and Imaging Conference(CIC23), pp.52-57, Oct. 2015.
Xiaomeng Wu, M. Mori, K. Kashino, “Data-driven taxonomy forest for fine-grained image categorization,” Multimedia and Expo (ICME), 2015 IEEE International Conference on, pp.1-6, 2015
Xiaomeng Wu, Kunio Kashino, “Adaptive Dither Voting for Robust Spatial Verification,” IEEE International Conference on Computer Vision (ICCV), pp.1877-1885, Dec, 2015
Xiaomeng Wu, Kunio Kashino, “Robust Spatial Matching as Ensemble of Weak Geometric Relations,” British Machine Vision Conference, British Machine Vision Association, pp.25.1-25.12, Sep. 2015.
Takuya Higuchi,　Hirokazu Kameoka, ”Unified approach for audio source separation with multichannel factorial HMM and DOA mixture model,” EUSIPCO, EURASIP, pp.2043-2047, Nice, Aug. 2015.
Minoru Mori, Xiaomeng Wu, Kunio Kashino, “Trademark Image Retrieval Using Inverse Total Feature Frequency and Multiple Detectors,” 16th International Conference on Computer Analysis of Images and Patterns (CAIP), pp.778-789, Sep. 2015.
Hirokazu Kameoka,“Modeling speech parameter sequences with latent trajectory hidden Markov model,” in Proc. The 25th IEEE International Workshop on Machine Learning for Signal Processing (MLSP2015), pp.1-6, Sep.2015.
Jiro Nakajima, Akisato Kimura, Akihiro Sugimoto, Kunio Kasshino "Visual attention driven by auditory cues: Selecting visual features in synchronization with attracting auditory events," Proc. International Conference on Multimedia Modeling (MMM2015), Vol.2, pp.74-86, Sydney, Australia, January 2015.
Daichi Kitamura, Nobutaka Ono, Hiroshi Sawada, Hirokazu Kameoka, Hiroshi Saruwatari, “Relaxation of rank-1 spatial constraint in overdetermined blind source separation,” The 2015 European Signal Processing Conference (EUSPCO 2015), pp.1261-1262, Aug. 2015.
Ryoji Wakayama, Ryuei Murata, Akisato Kimura, Takayoshi Yamashita, Yuji Yamauchi, Hironobu Fujiyoshi "Distributed forests for MapReduce-based machine learning," Proc. IAPR Asian Conference on Pattern Recognition (ACPR 2015), Kuala Lumpur, Malaysia, November 2015.
Sawa Kourogi, Akisato Kimura, Hiroyuki Fujishiro, Hitoshi Nishikawa "Identifying attractive headlines for social media," Proc. ACM International Conference on Information and Knowledge Management (CIKM2015), pp.1859-1862, Melbourne, Australia, October 2015.
Jun Fujiki, Masaru Tanaka, Hitoshi Sakano, Akisato Kimura "Geometric interpretation of Fisher's linear discriminant analysis through communication theory," Proc. IAPR International Conference on Machine Vision and Applications (MVA2015), pp.333-336, Tokyo, Japan, May 2015.

その他会議予稿

石黒勝彦，佐藤一誠，中野允裕，木村昭悟，上田修功 "Infinite bi-clusteringのための無限plaid model," 情報論的学習理論ワークショップ (IBIS2015)，茨城県つくば市，2015年11月．
M. Murata, H. Nagano, K. Hiramatsu, and K. Kashino, “Current Issues of Particle Filtering and Some Algorithmic Improvements,” The 58th Japan Joint Automatic Control Conference (JACC), 2015. (Invited)
Masaya Murata, Kaoru Hiramatsu, and Kunio Kashino, “Current Issues of Particle Filtering and Some Algorithmic Improvements,” The 47th ISCIE International Symposium on Stochastic Systems Theory and Its Applications (SSS’15), Dec. 2015.
石黒勝彦，木村昭悟 "サーベイ論文：パターン認識研究者のためのトピックモデリング概観," 電子情報通信学会技術報告，PRMU2015-000，長野県長野市, 2015年12月．
坂野鋭，木村昭悟，藤木淳，田中勝 "共分散行列の違いを許容する線形判別分析," 情報処理学会技術報告，2015-MPS-000，東京都調布市，2015年12月．
中野允裕，武小萌，森稔，木村昭悟，柏野邦夫 "R木過程," 電子情報通信学会技術報告，IBISML2015-000，2015年11月．
興梠紗和，藤代裕之，木村昭悟 "Twitterで拡散されるニュース説明文の構造解析," 社会情報学会 (SSI) 学会大会予稿集, 東京都中野区, 2015年9月.
牛久祥孝，木村昭悟，柏野邦夫 "時間に基づく画像検索のための周期構造の自動抽出," 画像の認識・理解シンポジウム (MIRU2015) 予稿集，大阪府吹田市，2015年7月
木村昭悟，石黒勝彦，Alejandro Marcos Alvarez，山田誠，片岡香織，村崎和彦 "ソーシャルキュレーションデータを用いた画像コンテクストマイニング," 情報処理学会技術報告，2015-MPS-000，沖縄県国頭郡恩納村，2015年6月．
若山涼至，木村昭悟，山下隆義，山内悠嗣，藤吉弘亘 "並列分散処理における共変量シフトを導入したrandom forestsの学習" 電子情報通信学会技術報告，PRMU2014-000，神奈川県横浜市港北区，2015年3月
興梠紗和，木村昭悟，藤代裕之，西川仁 "SNS上での拡散を誘発するwebニュース説明文の調査と自動選択," データ工学と情報マネジメントに関するフォーラム (DEIM2015) 予稿集，D4-4，福島県郡山市，2015年3月
中島次郎，木村昭悟，杉本晃宏，柏野邦夫 "音響信号との同期を考慮した視覚的顕著性の逐次計算モデル," 情報処理学会技術報告，2015-CVIM-195. 奈良県奈良市，2015年1月

2014

論文

A.Kimura, K.Duh, T.Hirao, K.Ishiguro, T.Iwata, C.M.Au Yeung, "Creating stories from socially curated microblog messages," to appear, IEICE Transactions on Information and Systems, Vol.E97-D, No.6, June 2014.
M.Mori, S.Uchida, H.Sakano,"Global Feature for Online Character Recognition," Pattern Recognition Letters, vol.35, no.1 pp.142-148, 2014.
竹内，石黒，木村，澤田 "非負制約下における複合行列分解とそのソーシャルメディア解析への応用," 情報処理学会論文誌数理モデルと応用, Vol.7, No.1, pp71-83, 2014.
X.Wu, K.Kashino,"Interest Point Selection by Topology Coherence for Multi-Query Image Retrieval.", Multimedia Tools and Applications

書籍、解説記事

井手剛，神嶌敏弘，栗田多喜夫，杉山将，前田英作 [監修]，井尻善久，井手剛，岩田具治，金森敬文，兼村厚範，烏山昌幸，河原吉伸，木村昭悟，小西嘉典，酒井智弥，鈴木大慈，竹内一郎，玉木徹，出口大輔，富岡亮太，波部斉，前田真一，持橋大地，山田誠 [訳] "統計的学習の基礎", 共立出版，2014年．
土田 "市販のデジタルカメラを用いたマルチスペクトル画像撮影システム", 映像情報メディア学会誌，Vol.68, No.4，特集「更なる進展が期待されるマルチスペクトル技術」, pp. 286-290，Apr, 2014.
柏野,"膨大なメディアデータの探索と活用～ビッグメディア時代のボトルネック解消に向けて～ ",NTT-技術ジャーナル2014 Vol.26 №4 ,pp.31-34. Apl.2014
A.Kimura, "Large-scale cross-media analysis and mining from socially curated contents."Progress in Informatics. Mar.2014
木村, 数原, 高橋, 横山,"画像検索でのユーザ行動を利用した大規模画像アノテーション"日本工業出版「画像ラボ」Vol.25, No.2, Feb.2014

招待講演

亀岡弘和, "非負値行列因子分解とその音声音響信号処理への応用," 第8回日本統計学会春季集会, 2014年3月8日.
木村,"[招待講演] コンテンツを見ないコンテンツ内容理解－人間行動解析を介したアプローチ", 音響学会春季研究発表会, Mar.2014
亀岡,"［招待講演］非負値行列因子分解による時系列パターン処理", 音響学会音声研究会, Feb.2014

国際会議予稿

Kento Kadowaki, Tatsuma Ishihara, Nobukatsu Hojo, Hirokazu Kameoka, "Speech prosody generation for text-to-speech synthesis based on generative model of F0 contours," in Proc. The 15th Annual Conference of the International Speech Communication Association (Interspeech 2014), Sep. 2014. (to appear)
Takuya Higuchi, Hirofumi Takeda, Tomohiko Nakamura, Hirokazu Kameoka, "A unified approach for underdetermined blind signal separation and source activity detection by multichannel factorial hidden Markov models," in Proc. The 15th Annual Conference of the International Speech Communication Association (Interspeech 2014), Sep. 2014. (to appear)
Ryosuke Sugiura, Yutaka Kamamoto, Noboru Harada, Hirokazu Kameoka, Takehiro Moriya, "Direct linear conversion of LSP parameters for perceptual control in speech and audio coding," in Proc. The 2014 European Signal Processing Conference (EUSIPCO 2014), Sep. 2014. (to appear)
Ryosuke Sugiura, Yutaka Kamamoto, Noboru Harada, Hirokazu Kameoka, Takehiro Moriya, "Representation of spectral envelope with warped frequency resolution for audio coder," in Proc. The 2014 European Signal Processing Conference (EUSIPCO 2014), Sep. 2014. (to appear)
Tomohiko Nakamura, Hirokazu Kameoka, "Fast signal reconstruction from magnitude spectrogram of continuous wavelet transform based on spectrogram consistency," Accepted for publication in Proc. the 17th International Conference on Digital Audio Effects (DAFx-14), Sep. 2014.
R.Ogata, M.Mori, V. Frinken, S.Uchida, "Constrained AdaBoost for Totally-Ordered Global Features," ICFHR2014, Sept.
X.Wu, K.Kashino,"Image Retrieval Based on Anisotropic Scaling and Shearing Invariant Geometric Coherence.", ICPR, Aug.2014
M.Mori, H.Kimiyama, M.Ogawara,"Seach-Based Content Analysis System on Online Collaborative Platform for Film Production.", ICPR2014, Aug.2014
M.Mori, T.Kurozumi, H.Nagano, K.Kashino,"Video Content Detection with Single Frame Level Accuracy Using Dynamic Thresholding Technique.", ICPR2014, Aug.2014
M. Tsuchida. K. Kashino, and J. Yamato, "Experimental Evaluation of Chromostereopsis with Varying Center Wavelength and FWHM of Spectral Power Distribution", ICISP2014 (MCS2014), LNCS 8509, Jun 2014.
M.Nakano, K.Ishiguro, A.Kimura, T.Yamada, N.Ueda "Rectangular tiling process," to appear, International Conference on Machine Learning (ICML2014), June 2014.
X.Wu, K.Kashino,"Image Retrieval Based on Spatial Context with Relaxed Gabriel Graph Pyramid.", ICASSP2014, May.2014
Y.Ohishi, D.Mochihashi, H.Kameoka, K.Kashino,"Mixture of Gaussian Process experts for predicting sung melodic contour with expressive dynamic fluctuations.", ICASSP2014, May.2014
Takuya Higuchi, Norihiro Takamune, Tomohiko Nakamura, Hirokazu Kameoka, "Underdetermined blind separation and tracking of moving sources based on DOA-HMM, Accepted for publication in Proc. 2014 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2014), pp. 3215-3219, May 2014.

その他会議予稿

亀岡弘和, 饗庭絵里子, 大石康智, 北原鉄朗, 北村達也, 佐藤圧衛, 戸上真人, 戸田智基, 吉井和佳, "音学シンポジウム2014の開催にあたって," 電子情報通信学会技術研究報告, vol. 114, no. 52, pp. 1-3, May. 2014.
四方紘太郎, 高宗典玄, 中村友彦, 亀岡弘和, "調波時間因子分解法に基づく事前情報付き多重音解析," 情報処理学会研究報告, vol. 2014-MUS-103, no.18, May. 2014.
杉浦亮介, 鎌本優, 原田登, 亀岡弘和, 守谷健弘, "音響符号化のための周波数解像度の伸縮されたスペクトル包絡の表現法," 情報処理学会研究報告, vol.2014-MUS-103, no. 39, May. 2014.
高宗典玄, 亀岡弘和, "補助関数法によるGaussian-Bernoulli RBMの学習アルゴリズムの検討," 情報処理学会研究報告, vol. 2014-MUS-103, no. 40, May.2014.
中村友彦, 亀岡弘和, "無矛盾性規準に基づく連続ウェーブレット変換スペクトログラムへの位相推定法と高速化," 情報処理学会研究報告, vol.2014-MUS-103, no. 41, May. 2014.
大石康智, 持橋大地, 亀岡弘和, 柏野邦夫, "ガウス過程回帰の混合エキスパートモデルを用いた歌声F0軌跡の予測と歌唱表現変換," 情報処理学会研究報告, vol. 2014-MUS-103, no. 49, May. 2014.
樋口卓哉, 高宗典玄, 中村友彦, 亀岡弘和, "確率的モデル化に基づく移動音源の劣決定ブラインド音源分離," 電子情報通信学会技術研究報告, vol. 114,no. 52, pp. 211-216, May. 2014.
門脇健人, 北条伸克, 石原達馬, 亀岡弘和, "音声F0パターン生成過程の確率モデルによるテキストからの韻律生成," 電子情報通信学会技術研究報告, vol.114, no. 52, pp. 309-314, May. 2014.
村田, 永野, 柏野,"非線形ガウス型観測モデルに対するiterative unscented statistical linearization", 第58回システム制御情報学会研究発表講演会, May.2014
土田, 柏野, 大和,"ステレオ式11バンドカメラシステム", 視覚情報基礎研究会, Mar.2014
門脇, 石原, 北条, 亀岡,"音声F0パターン生成過程の確率モデルに基づくテキストからの韻律生成", 音響学会春季研究発表会, Mar.2014
四方, 高宗, 中村, 亀岡,"調波時間因子分解に基づく音楽事前情報付き多重音解析", 音響学会春季研究発表会, Mar.2014
高宗, 石原, 亀岡,"補助関数法による制約付きボルツマンマシンの学習アルゴリズムの検討 ", 音響学会春季研究発表会, Mar.2014
中村, 亀岡,"連続ウェーブレット変換の高速近似アルゴリズムに基づく振幅スケーログラムへの無矛盾位相付加法の検討", 音響学会春季研究発表会, Mar.2014
T.Ishihara, K.Yoshisato, H.Kameoka,"Prosody Conversion Based on Joint Generative Model of F0 Contours", 音響学会春季研究発表会, Mar.2014
土田, 柏野, 大和,"ステレオ式11バンドカメラシステム", 視覚情報基礎研究会, Mar.2014
門脇, 大石, 石原, 北条, 亀岡,"音声F0パターン生成過程の確率モデルに基づく非母国語話者音声の韻律補正法の検討 ", 音響学会春季研究発表会, Mar.2014
大石, 亀岡, 小野, 石本, 松井, 板橋,"トピック遷移PLSAに基づくメルスペクトログラム生成モデルを用いた多言語音声分類手法の評価", 音響学会春季研究発表会, Mar.2014
大石, 持橋, 亀岡, 柏野,"ガウス過程回帰の混合エキスパートモデルを用いた歌声F0軌跡の予測と生成", 音響学会春季研究発表会, Mar.2014
田良島, 三上, 木村,"ACM Multimedia 2013 参加報告と関連研究動向",オーディオビジュアル複合情報処理研究会, Feb.2014
田渕, 高橋, 出口, 井手, 村瀬, 黒住, 柏野,"空間的な人数分布推定のための記憶型回帰の検討", パターン認識・メディア理解研究会(PRMU), Feb.2014
村田, 永野, 柏野, 佐藤,"Exponential BM25によるインスタンスサーチ ", パターン認識・メディア理解研究会(PRMU2014), Jan.2014
原田,"一般人にプログラミングの重要さを伝える", 第55回プログラミングシンポジウム, Jan.2014

2013

論文

亀岡, 佐藤, 小野拓, 小野順, 嵯峨山,"Bayesian nonparametric approach to blind separation of infinitely many sparse sources.",英文論文誌A, IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences. Vol.E96-A, №10, Oct.2013
木村，数原，高橋，横山 "画像検索でのユーザ行動を利用した大規模画像アノテーション," 電子情報通信学会論文誌，Vol.J96-D，No.8, pp.1711-1723, Aug 2013．
M.Tsuchida, S.Sakai, M.Miura, K.Ito, T.Kawanishi, K.Kashino, J.Yamato, T.Aoki,"Stereo One-shot Six-band Camera System for Accurate Color Reproduction.",Journal of Electronic Imaging, Vol.22, Issue03, Jul.2013
森, 内田, 坂野,"大局的特徴に対するDPマッチング", 電子情報通信学会論文誌-D vol.J96-D №7 pp.1654-1657, Jul.2013
A.Kimura, M.Sugiyama, H.Kameoka, H.Sakano "Designing various component analysis at will via generalized pairwise expression," IPSJ Transactions on Mathematical Modeling and its Applications, Vol.6, No.1, pp.128-135, March 2013.
A.Kimura, M.Sugiyama, T.Nakano, H.Kameoka, H.Sakano, E.Maeda, K.Ishiguro "SemiCCA: Efficient semi-supervised learning of canonical correlations," IPSJ Transactions on Mathematical Modeling and its Applications, Vol.6, No.1, pp.136-145, March 2013.
A.Kimura, R.Yonetani, T.Hirayama "Computational models of human visual attention and their implementations: A survey," IEICE Transactions on Information and Systems, Vol.E96-D, No.3, pp.562--578, March 2013. （平成25年度電子情報通信学会情報・システムソサイエティ論文賞受賞（2014年6月11日））

書籍、解説記事

木村,"2014年期待の新産業－ Google Glassとは何か", 文藝春秋社「文藝春秋オピニオン 2014年の論点100」,Nov.2013
森, 柏野,"多重領域ヒストグラムの高速なウィンドウサーチ",日本工業出版-画像ラボ, May.2013

招待講演

木村,"[招待講演] 技術が可能にするオープンプライバシー社会：その光と影",　情報ネットワーク法学会研究大会, Nov.2013
M.Tsuchida, "High-resolution and Multiband Image-capturing System.",International Meeting on Information Display, Aug.2013
M.Tsuchida, S.Sakai, K.Ito, R.Mukai, K.Kashino, J.Yamato, T.Aoki, "A stereo six-band motion picture capturing using 4K digital cinema camera.", SIGGRAPH DCAJ Session, Jul.2013
木村,"[招待講演] 確かな大規模情報源としてのキュレーションメディア：その可能性と未来 ",画像センシング展2013 ,Jun.2013
柏野,"[招待講演] 聴覚コンピューティングと産業応用", 情処学会音楽情報科学研究会, May2013
木村,"[招待講演] ソーシャルメディア・ライフログのすべてを受け入れたキンミライ", ソーシャルメディア時代の情報流通と制度設計, Apl.2013
A. Kimura "Social curation as corpora for large-scale multimedia content analysis," ACM International Conference on Multimedia Retrieval (ICMR2013), April 2013.
木村 "[特別講演] マルチメディア解析コーパスとしてのsocial curationの可能性"，電子情報通信学会パターン認識・メディア理解研究会 (PRMU)，Feb 2013.

国際会議予稿

K.Takeuchi, R.Tomioka, K.Ishiguro, A.Kimura, H.Sawada "Non-negative multiple tensor factorization," Proc. IEEE International Conference on Data Mining (ICDM2013), pp.1199-1204, December 2013.
M.Murata, H.Nagano, K.Kashino, S.Sato,"NTT Communication Science Laboratories and National Institute of Informatics at TRECVID 2013 Instance Search Task."TRECVID Workshop 2013, Nov.2013
M.Tsuchida, K.Kashino, J.Yamato,"An eleven-band stereoscopic camera system for accurate color and spectral reproduction.",Color and Imaging Conference, Nov.2013
A.Kimura, K.Ishiguro, A.Marcos Alvarez, K.Kataoka, K.Murasaki, M.Yamada "Image context discovery from socially curated contents" Proc. ACM International Conference on Multimedia (ACMMM2013), pp.565-568, October 2013.
A.M.Alvarez, M.Yamada, A.Kimura,"Exploiting socially-generated side information to improve dimensionality reduction.", Int. Work. Socially-Aware Multimedia, Oct.2013
A.M.Alvarez, M.Yamada, A.Kimura, T.Iwata,"Clustering-Based Anomaly Detection in Multi-View Data.", CIKM2013, Oct.2013
M.Tsuchida, A.Takayanagi, W.Wakita, K.Kashino, J.Yamato, H.Tanaka,"Digital Archiving of Tapestries of Kyoto Gion Festival using a High-definition and Multispectral Image Capturing System."The International Conference on Culture and Computing. Sep.2013
K.Takeuchi, K.Ishiguro, A.Kimura, H.Sawada "Non-negative multiple matrix factorization," Proc. International Joint Conference on Artificial Intelligence (IJCAI2013), pp.1713-1720, August 2013.
M.Yamada, A.Kimura, F.Naya, H.Sawada, "Change-point detection with feature selection in high-dimensional time-series data," Proc. International Joint Conference on Artificial Intelligence (IJCAI2013), pp.1827-1833, August 2013.
H.Kameoka, K.Yoshizato, T.Ishihara, Y.Ohishi, K.Kashino, S.Sagayama,"Generative modeling of speech F0 contours.", 2013Interspeech, Aug.2013
T.Ishihara, H.Kameoka, K.Yoshizato, D.Saito, S.Sagayama,"Probabilistic speech F0 contour model incorporating statistical vocabulary model of phrase-accent command sequence.", 2013Interspeech, Aug.2013
N.Hojo, K.Yoshizato, H.Kameoka, D.Saito, S.Sagayama, "Text-to-speech synthesizer based on combination of composite wavelet and hidden Markov models.", 8th ISCA Speech Synthesis Workshop, Aug.2013
M.Tsuchida, T.Kawanishi, R.Mukai, K.Kashino, J.Yamato,"Extension of Dynamic Range of Camera System based on Multi-band image Capturing.",12th International AIC Congress, Jul.2013
M.Tsuchida, A.Takayanagi, Y.Sakaguchi, R.Mukai, K.Kashino, J.Yamato, H.Tanaka, "Estimation of Spectral Reflectance from Six-band Images based on Partial Least-squares Regression." 12th International AIC Congress, Jul.2013
K.O'Hanlon, H.Nagano, M.D.Plumbley,"Using Oracle Analysis for Decomposition-Based Automatic Music Transcription.", LNCS (CMMR 2012, Revised Selected Papers), Jun 2013.
M.Murata, K.Kashino,"Normalized Unscented Kalman Filter and Normalized Unscented RTS Smoother for Nonlinear State-Space Model Identification.", 2013 American Control Conference, Jun.2013
T.Higuchi, N.Takamune, T.Nakamura, H.Kameoka,"Underdetermined blind separation and tracking of moving sources based on DOA-HMM.", ICASSP2013, May.2013
Y.Ohishi, D.Mochihashi, T.Matsui, M.Nakano, H.Kameoka, T.Izumitani, K.Kashino,"Bayesian Semi-supervised Audio Event Diarization Based on Markov Indian Buffet Process.", ICASSP2013, May.2013
K.O'Hanlon, H.Nagano, M.D.Plumbley, "Structured Sparsity for Automatic Music Transcription.", ICASSP2012, Mar.2013

その他会議予稿

緒方, 森, 内田,"全順序列を持つ大局的特徴系列の選択とその利用", パターン認識・メディア理解研究会(PRMU), Dec.2013
中野，石黒，木村，山田，上田 "関係データ解析のための長方形分割過程," 情報論的学習理論ワークショップ, Nov 2013.
竹内，富岡，石黒，木村，澤田 "複合非負テンソル因子分解法" 情報論的学習理論ワークショップ（IBIS2013），November 2013.
A.M.Alvarez, 山田, 木村, 岩田,"Multi-view anomaly detection based on clustering inconsistency ", 情報論的学習理論ワークショップ, Nov.2013
村田, 永野, 柏野,"不確かな非線形システムモデルに対するロバストフィルタの設計", 第56回自動制御連合講演会, Nov.2013
北条, 亀岡, 嵯峨山,"複合ウェーブレットトラジェクトリモデルに基づくテキスト音声合成 ",信学会音声研究会, Nov.2013
田渕, 高橋, 出口, 井手, 村瀬, 黒住, 柏野,"複数カメラを用いた人数分布推定に関する検討",パターン認識・メディア理解研究会(PRMU), Oct.2013
緒方, 森, 内田,"全順序性を持つ大局的特徴系列の選択",電気関係学会九州支部連合大会, Sep.2013
村田, 永野, 柏野,"カルマンフィルタの準最適化によるロバストフィルタの設計" 2013年度統計関連学会連合大会, Sep.2013
坂野，藤木，木村 "クラス部分空間に着目した判別分析" 画像の認識・理解シンポジウム (MIRU2013) 予稿集，Jul 2013.
片岡，木村，村崎，数藤，谷口 "ユーザ履歴を利用した潜在トピックによる画像へのユーザ嗜好のモデリング," 画像の認識・理解シンポジウム (MIRU2013) 予稿集，Jul 2013．
A.M.Alvarez, 山田, 木村,"Dimensionality reduction with side information for image classification.",画像の認識・理解シンポジウム(MIRU2013), Jul.2013
片岡，木村，村崎，数藤，谷口 "パーソナライズド画像検索のためのユーザの画像嗜好度解析," 画像センシングシンポジウム (SSII2013)予稿集，Jun 2013.
木村, 柳沢, 須山, 納谷,"画像処理技術による育苗箱内発芽箇所の推定 - 農作物栽培環境・生育状況のセンシングに向けた取り組み - ",画像センシングシンポジウム, Jun.2013
竹内，石黒，木村悟，澤田 "非負制約下における複合行列分解," 情報処理学会数理モデル化と問題解決研究会 (MPS)，May 2013（MPS93ベストプレゼンテーション賞受賞）．
村田, 永野, 柏野,"構造変化を伴うダイナミクス下における準最適カルマンフィルタの設計",第57回システム制御情報学会研究発表講演会, May.2013
北条, 吉里, 亀岡, 齋藤, 嵯峨山,"複合ウェーブレットモデルとHMMの統合モデルによるテキスト音声合成",音楽情報科学研究会, May.2013
橘, 亀岡, 小野, 嵯峨山,"スペクトログラムの長距離滑らかさを考慮した調波打楽器音分離",音楽情報科学研究会, May.2013
石原, 吉里, 亀岡, 齋藤, 嵯峨山,"音声基本周波数の藤崎モデル指令列の統計的語彙モデル",音楽情報科学研究会, May.2013
木村, 石黒, A.M.Alvarez, 片岡, 村崎, 山田, "ソーシャルキュレーションデータを用いた画像コンテクストマイニング", 第16回画像の認識・理解シンポジウム(MIRU2013), Jul 2013（MIRU2013インタラクティブ発表賞受賞（2013年8月1日））
吉里, 北条, 亀岡, 齋藤, 嵯峨山,"フォルマント周波数軌跡を潜在パラメータとした音声スペクトル生成過程の確率モデル", 音響学会春季研究発表会, Mar.2013
石原, 吉里, 亀岡, 齋藤, 嵯峨山,"音声基本周波数の藤崎モデル指令列の統計的語彙モデル", 音響学会春季研究発表会, Mar.2013
北条, 吉里, 亀岡, 齋藤, 嵯峨山,"複合ウェーブレットモデルと隠れマルコフモデルの統合モデルによるテキスト音声合成", 音響学会春季研究発表会, Mar.2013
池澤, 北条, ミケル, 亀岡, 嵯峨山,"非定常雑音・時変残響環境下でのパワースペクトログラム領域セミブラインド音声強調", 信学会全国大会, Mar.2013
市川, 森,"情報処理が切り拓く知識社会", 2013年電子情報通信学会総合大会(IEICE), Mar.2013
柏野,"PRMU研究会における社会問題への取り組み", 2013年電子情報通信学会総合大会(IEICE), Mar.2013
田渕, 高橋, 出口, 井手, 村瀬, 泉谷, 柏野,"視体積交差法を用いた複数カメラから人数推定に関する検討", 2013年電子情報通信学会総合大会(IEICE), Mar.2013
高柳, 土田, 坂口, 田中,"マルチバンド画像を用いた織物の鏡面反射光の解析",コンピュータビジョンとイメージメディア研究会CVIM), Mar.2013
大石, 亀岡, 小野, 石本, 松井, 板橋,"トピック遷移PLSAに基づくメルスペクトログラム生成モデルを用いた多言語音声分類の検討", 音響学会春季研究発表会, Mar.2013
大石, 持橋, 松井, 中野, 亀岡, 泉谷, 柏野,"mIBPに基づくベイジアン半教師付き音響イベントダイアライゼーション",音響学会春季研究発表会, Mar.2013
片岡，木村，村崎，数藤，谷口 "SNSを利用したトピックモデルによる画像へのユーザ嗜好性の解析"，電子情報通信学会パターン認識・メディア理解研究会 (PRMU), Feb 2013.
村田, 永野, 向井, 柏野, 佐藤,"画像をクエリとしたインスタンス映像検索",パターン認識・メディア理解研究会(PRMU2013), Feb.2013
土田, 酒井, 三浦, 伊藤, 川西, 柏野, 大和, 青木,"正確な色再現を目的とした２眼ステレオ式６バンドビデオシステム", パターン認識・メディア理解研究会(PRMU2012), Jan.2013

2012

論文

森, 柏野,"多重領域ヒストグラムを用いた高速なウィンドウサーチ",電子情報通信学会論文誌. D, 情報・システム J95-D(8), 1500-1510, Aug.2012
T.Endrjukaite, N.Kosugi,"Music Visualization Technique of Repetitive Structure Representation to Support Intuitive Estimation of Music Affinity and Lightness.", Journal of Mobile Multimedia, 8(1):49-71 (2012), Apl.2012

書籍、解説記事

柏野,"パターン認識・メディア理解の研究最前線", 情報・システムソサイエティ誌第17巻第3号(通巻68号)pp.6-7, Nov.2012
亀岡,"非負値行列因子分解の音響信号処理への応用.",日本音響学会誌,68巻11号（2012）pp.559-565, 2012, Nov.2012
亀岡,"非負値行列因子分解",『計測と制御』計測自動制御学会, Vol. 51, No. 9, pp. 835-844, Sep. 2012

招待講演

亀岡弘和, "非負値行列因子分解とその音響信号処理応用," 電子情報通信学会・日本音響学会応用音響研究会, 2012年12月14日.
亀岡弘和, "生成モデルアプローチによる音響信号処理," 奈良先端科学技術大学院大学ゼミナールⅠ講演, 2012年12月18日.
亀岡弘和, "生成モデルアプローチによる音声音響信号処理," 第15回情報論的学習理論ワークショップ(IBIS2012), 2012年11月9日.
中野,"[招待講演] ノンパラメトリックベイズによるメディア処理",第36回人工知能学会AIチャレンジ研究会, Nov.2012
M.Tsuchida, T.Kawanishi, K.Kashino, J.Yamato, "A stereo nine-band camera for accurate color and spectrum reproduction," SIGGRAPH DCAJ Session, Aug.2012

国際会議予稿

M.Murata, H.Nagano, K.Kashino,"Robustifying Kalman Filter to Rapidly Adapt Significant Chages in System Model Parameters of State-Space Models.", The52th IEEE Conference on Decision and Control, Dec.2012
T.Endrjukaite, N.Kosugi,"Time-dependent genre recognition by means of Instantaneous Frequency Spectrum based on Hilbert-Huang Transform.", The 14th iiWAS, Dec.2012
M.Murata, T.Izumitani, H.Nagano, R.Mukai, K.Kashino, S.Sato,"NTT Communication Science Laboratories and National Institute of Informatics at TRECVID 2012 Instance Search and Multimedia Event Detection Tasks.", TRECVID2012, Nov.2012
M.Tsuchida, S.Sakai, M.Miura, K.Ito, T.Kawanishi, K.Kashino, J.Yamato, T.Aoki, "A six-band stereoscopic video camera system for accurate color reproduction.", Color and Imaging Conference, Nov.2012
W.Wakita, M.Tsuchida, S.Tanaka, T.Kawanishi, K.Kashino, J.Yamato, H.Tanaka, "High-resolution and Multi-spectral Capturing for Digital Archiving of Large 3D Woven Cultural Artifacts.", The 2nd ACCV Workshop on e-Heritage 2012, Nov.2012
H.Kameoka, K.Ochiai, M.Nakano, M.Tsuchiya, S.Sagayama,"CONTEXT-FREE 2D TREE STRUCTURE MODEL OF MUSICAL NOTES FOR BAYESIAN MODELING OF POLYPHONIC SPECTROGRAMS.", The 13th International Society for Music Information Retrieval Conference (ISMIR), Oct.2012
K.Yoshizato, H.Kameoka, D.Saito, S.Sagayama,"Hidden Markov convolutive mixture model for pitch contour analysis of speech.", 13th Annual Conference of the International Speech Communication Association(Interspeech2012), Sep.2012
H.Kameoka, M.Sato, T.Ono. N.Ono, S.Sagayama,"BLIND SEPARATION OF INFINITELY MANY SPARSE SOURCES.",International Workshop on Acoustic Signal Enhancement 2012(IWAENC), Sep.2012
Y.Ohishi, H.Kameoka, D.Mochihashi, K.Kashino,"A Stochastic Model of Singing Voice F0 Contours for Characterizing Expressive Dynamic Components.",Interspeech2012, Sep.2012
M.Mori, S.Uchida, H.Sakano,"Dynamic Programming Matching with Global Features for Online Character Recognition.", International Conference on Frontiers in Handwriting Recognition(ICFHR2012), Sep.2012
N.Kosugi, M.Kondo,"Community Site for Music Therapists Based on the Records.", The 15th International Conference on Network-Based, Sep.2012
W.Wakita, M.Tsuchida, S.Tanaka, T.Kawanishi, K.Kashino, J.Yamato, H.Tanaka, ""High-definition and Multispectral Capturing for Digital Archiving of Large 3D Woven Cultural Artifacts."",SIGGRAPH '12 ACM SIGGRAPH 2012 Posters, Aug.2012
T.Murayama, D.Peter,"Rate Distortion Codes for the Collective Estimation from Indepenent Noisy Observations.", ISIT2012, Jul.2012
D.Mikami, S.Kimura, K.Kadota, M.Kashino, K.Kashino,"INTER-TRIAL DIFFERENCE ANALYSIS THROUGH APPEARANCE-BASED MOTION TRACKING.", International society of biomechanics in sports, Jul.2012
K.O'Hanlon, H.Nagano, M.D.Plumbley, "Structured Sparsity for Automatic Music Transcription.", ICASSP2012, Mar 2012.
K.O'Hanlon, M.D.Plumbley, H.Nagano,"Group Non-negative Basis Pursuit for Automatic Music Transcription.", MML2012, Jun.2012
K.Yoshizato, H.Kameoka, D.Saito, S.Sagayama,"Statistical approach to Fujisaki-model parameter estimation from speech signals and its quantitative evaluation.", in Proc. Speech Prosody 2012, May.2012
M.Nakano, Y.Ohishi, H.Kameoka, R.Mukai, K.Kashino,"Bayesian nonparametric music parser.", ICASSP2012, Mar.2012
K.Ochiai, H.Kameoka, S.Sagayama,"EXPLICIT BEAT STRUCTURE MODELING FOR NON-NEGATIVE MATRIX FACTORIZATION-BASED MULTIPITCH ANALYSIS.", ICASSP2012 Mar.2012
H.Tachibana, H.Kameoka, N.Ono, S.Sagayama,"COMPARATIVE EVALUATIONS OF VARIOUS HARMONIC/PERCUSSIVE SOUND SEPARATION ALGORITHMS BASED ON ANISOTROPIC CONTINUITY OF SPECTROGRAM.", ICASSP2012, Mar.2012
H.Kameoka, H.Nakano, K.Ochiai, Y.Imoto, K.Kahino, S.Sagayama,"Constrained and Regularized Variants of Non-negative Matrix Factorization Incorporating Music-Specific Constraints.", ICASSP2012, Mar.2012
M.Mori, S.Uchida, H.Sakano,"How Is the Importance of Global Structurefor Characters ?",DAS2012, Mar.2012
D.Mikami, K.Otsuka, S.Kumano, J.Yamato,"Enhancing Memory-based Particle Filter with Detection-based Memory Acquisition for Robustness under Severe Occlusion.", VISAPP2012, Feb.2012

その他会議予稿

土田, 川西, 向井, 柏野, 大和,"マルチバンド撮影による画像入力システムのダイナミックレンジ拡大", 第14回視覚情報基礎研究会, Dec.2012
土田, 向井, 柏野, 大和,"金箔の分光反射率解析とマルチバンド撮影による色再現性の評価", 測色研究会, Dec.2012
小杉,"情報通信技術を用いた音楽療法(大量の施術情報による効果評価と音楽療法データ・マイニング)(最先端・次世代研究開発支援プログラム)", ウェアラブル環境情報ネット推進機構ポスターセッション, Dec.2012
大石, 亀岡, 持橋, 永野, 柏野,"歌声F0系列からの楽譜逸脱成分の抽出－動特性モデルに基づく楽譜との時間的対応付け－",音響学会秋季研究発表会, Sep.2012
大石, 持橋, 松井, 中野, 亀岡, 泉谷, 柏野,"無限混合モデルを入れ子にしたmIBPに基づく音響イベント検出", 音響学会秋季研究発表会, Sep.2012
村田, 高屋, 内山, 柏野,"Unscented Kalman Filterにおけるシステム・観測雑音に注目した正規化法"2012年度統計関連学会連合大会 JFSSA, Sep.2012
村田, 高屋, 内山, 柏野,"突発変動成分を含む時系列解析モデルと線形回帰分析",2012年度統計関連学会連合大会 JFSSA, Sep.2012
高宗, 亀岡, 土屋, 嵯峨山,"補助関数法による音楽音響信号へのMIDI 信号の詳細なフィッティング.", 音響学会秋季研究発表会, Sep.2012
北条, 南, 齋藤, 亀岡, 嵯峨山,"複合ウェーブレットモデル分析合成系に基づくHMM音声合成", 音響学会秋季研究発表会, Sep.2012
齋藤, 石原, 橘, 亀岡, 嵯峨山,"声質空間上での変換を用いた歌声らしさの転写", 音響学会秋季研究発表会, Sep.2012
三上, 木村, 門田, 柏野邦, 柏野牧,"実試合環境における人物動作の解析手法の提案", 日本バイオメカニクス学会第22回大会, Sep.2012
齋藤, 石原, 橘, 亀岡, 嵯峨山,"声質空間上での変換に基づく歌声らしさの転写に関する検討",第96回音楽情報科学研究発表会, Aug.2012
高宗, 亀岡, 土屋, 嵯峨山,"補助関数法によるMIDI信号の音楽音響信号への詳細なフィッティング",第96回音楽情報科学研究発表会, Aug.2012
森, 内田, 坂野,"DPマッチングにおける大局的構造情報の導入",画像の認識・理解シンポジウム(MIRU2012), Aug.2012
吉里, 亀岡, 齋藤, 嵯峨山,"F0パターン生成過程の確率モデルによる藤崎モデルパラメータの推定", 第92回音声言語情報処理研究会(SIG-SLP), Jul.2012
大石, 持橋, 松井, 中野, 亀岡, 泉谷, 柏野,"ノンパラメトリックベイズアプローチに基づく音響イベント検出", パターン認識・メディア理解研究会(PRMU,NLC), Jun.2012
中野, 大石, 亀岡, 向井, 柏野,"モンドリアンHMMによる音楽信号の解析",パターン認識・メディア理解研究会(PRMU,NLC), Jun.2012
村山,D.Peter,"センシングと符号化の協同現象とクラメールの定理", 第3回情報ネットワーク科学研究会, May.2012
小杉, 佐々木, グエン=ティゴック=ジェップ, 清木,"フィジカル・エクササイズのための個人特性対応型音楽ガイドシステムに関する研究", 人間情報学会ポスターセッション, Mar.2012
武田, 亀岡, 澤田, 荒木, 宮部, 山田, 牧野,"混合DOAモデルに基づく多チャンネル複素NMFによる劣決定BSS", 音響学会春季研究発表会, Mar.2012
田沼, 中野, 藤田, 亀岡, 嵯峨山,"重畳マルコフ連鎖スペクトルモデルに基づく半教師あり学習による楽器音分離", 音響学会春季研究発表会､ Mar.2012
落合, 亀岡, 中野, 嵯峨山,"音楽生成プロセスの階層ベイズモデリングによる音響信号の自動採譜", 音響学会春季研究発表会､ Mar.2012
小野, 亀岡, 小野, 嵯峨山,"調波構造テンプレートに基づく独立ベクトル分析によるブラインド音源分離の検討", 音響学会春季研究発表会､ Mar.2012
吉里, 亀岡, 齋藤, 嵯峨山,"F0 パターン生成過程の統計的モデルによる音声信号からのフレーズ・アクセント指令の推定", 音響学会春季研究発表会､ Mar.2012
亀岡,佐藤, 小野拓, 小野順, 嵯峨山,"ノンパラメトリックベイズアプローチによる劣決定スパースBSS", 音響学会春季研究発表会, Mar.2012
大石, 亀岡, 持橋, 柏野,"ノート指令と表現指令によって駆動される歌声F0生成過程の統計モデル", 音響学会春季研究発表会, Mar.2012
K.Kashino,"Detection and the Use of Similarity and Dissimilarity", DMASM 2012, Feb.2012
大石, 亀岡, 持橋, 柏野,"歌唱における表現意図を考慮した歌声F0生成過程とその統計的モデリング"音楽情報科学研究会, Feb.2012

2011

論文

D.Mikami, K.Otsuka, S.Kumano, J.Yamato,"Enhancing Memory-based Particle Filter with Detection-based Memory Acquisition for Robustness under Severe Occlusion.", Trans. IEICE. Jpn., Vol.E95-D No.11 pp.2693-2703, Nov.2011
三上, 大塚, 大和,"姿勢とアピアランスの変化に頑健な対象追跡を実現するアピアランス統合メモリベースパーティクルフィルタ",信学会論文誌D-Ⅱ,情報・システム J94-D(8), 1194-1205, Aug.2011
森, 柏野,"適応的領域分割と初期閾値推定によるテンプレートマッチングの高速化",信学会論文誌D, 情報・システム J94-D(5), 881-892, May.2011
R.Mukai, T.Kurozumi, T.Kawanishi, H.Nagano, K.Kashino,"Robust Media Search Technology for Content-Based Audio and Video Identification."IEEE COMSOC MMTC E-Letter, Vol.6, No.1, Jan.2011

書籍、解説記事

川西, 向井, 平松, 黒住, 永野, 柏野,"音楽や映像を特定するメディア指紋技術とその応用", 日本応用数理学会誌「応用数理」, Vol.21, No.4, Dec.2011（2011年度日本応用数理学会ベストオーサー賞(インダストリアルマテリアルズ部門) (2012年8月30日)）
村山,"大偏差原理", 朝倉書店-数理工学辞典, pp78-81, Nov.2011
M.Mori,"Recent Advances in Document Recognition and Understanding."Recent Advances in Document Recognition and Unders, InTech, Oct.2011
土田, 川西, 柏野, 大和,"分光画像撮影技術による文化財デジタルアーカイブ", NTT技術ジャーナル誌(日本語), 2011 Vol.23 №10, pp48-50, Oct.2011
森,"適応的領域分割と閾値推定による高速テンプレートマッチング",日本工業出版『画像ラボ』 22(8), 15-19, Aug.2011
K.Otsuka,"Conversation Scene Analysis.", IEEE Signal Processing Magazine, 28(4):127-131, 2011

国際会議予稿

A.Gumulia, B.Puzon, N.Kosugi,"Music Visualization: predicting the perceived speed of a composition.", ACM Multimedia, Dec.2011
B.Puzon, N.Kosugi,"Extracting and Visualizing the Repetitive Structure of Music in Acoustic Data -- Misual Project --., iiWAS2011, Dec.2011
T.Kawanishi, K.Kashino, Y.Q.Sun, S.Sato, D.D.Le, C.Zhu,"NTT Communication Science Laboratories and NII at TRECVID 2011 Instance Search Task.", TRECVID2011, Dec.2011
R.Mukai, T.Kurozumi, T.Kawanishi, H.Nagano, K.Kashino,"NTT Communication Science Laboratories at TRECVID 2011 Content-Based Copy Detection."TRECVID2011, Dec.2011
M.Tsuchida, S.Sakai, K.Ito, T.Kawanishi, K.Kashino, J.Yamato, T.Aoki,"Evaluating Color Reproduction Accuracy of Stereo One-shot Six-band Camera System.", Color and Imaging Conference, Nov.2011
K.Takeda, Hi.Kameoka, H.Sawada, S.Araki, T.Yamada, S.Makino,"UNDERDETERMINED BSS WITH MULTICHANNEL COMPLEX NMF ASSUMING W-DISJOINT ORTHOGONALITY OF SOURCES.", TENCON2011, Nov.2011
M.Nakano, J.Le Roux, H.Kameoka, T.Nakamura, N.Ono, S.Sagayama."Bayesian Nonparametric Spectrogram Modeling Based on Infinite Factorial Infinite Hidden Markov Model.", WASPAA2011, Oct.2011
K.Kashino,"Content Identifies Itself - Production/Use Management for Moving Pictures with Robust Media Search Technology -.",CineGrid@TIFF, Oct.2011
K.Kashino,"Large-scale audio and video analysis and identification.", MLSP2011. Sep.2011
K.Otsuka,"Multimodal Conversation Scene Analysis for Understanding People’s Communicative Behaviors in Face-to-face Meetings.", HCI International 2011, Jul.2011
M.Nakano, J.L.Roux, H.Kameoka, N.Ono, S.Sagayama,,"INFINITE-STATE SPECTRUM MODEL FOR MUSIC SIGNAL ANALYSIS."ICASSP,May 2011
J.Takagi, Y.Ohishi, A.Kimura, M.Sugiyama, M.Yamada, H.Kameoka,"AUTOMATIC AUDIO TAG CLASSIFICATION VIA SEMI-SUPERVISED CANONICAL DENSITY ESTIMATION",ICASSP, May.2011
N.Yasuraoka, H.Kameoka, T.Yoshioka, H.Okuno,"I-DIVERGENCE-BASED DEREVERBERATION METHOD WITH AUXILIARY FUNCTION APPROACH.", ICASSP2011, May.2011
T.Nakano, A.Kimura, H.Kameoka, S.Miyabe, S.Sagayama, N.Ono, K.Kashino, T.Nishimoto,"AUTOMATIC VIDEO ANNOTATION VIA HIERARCHICAL TOPIC TRAJECTORY MODEL CONSIDERING CROSS-MODAL CORRELATIONS.",ICASSP2011, May.2011
S.Kumano, K.Otsuka, D.Mikami, J.Yamato,"Analyzing Empathetic Interactions based on the Probabilistic Modeling of the Co-occurrence Patterns of Facial Expressions in Group Meetings.",FG (Automatic Face and Gesture Recognition) ,Mar.2011
K.Hiramatsu, R.Mukai, K.Kashino,"NTT's new Media Retrieval System."2011 HPA Tech Retreat, Feb.2011
R.Mukai, K.Hiramatsu,"Demonstration of RMS Technology.", DMASM 2011, Feb.2011
K.Kashino,"Research and Development of Robust Media Search Technology.", DMASM2011 , Feb.2011

その他会議予稿

高柳, 土田, 鳥居, 河内, 中田, 田中(士), 脇田, 田中(弘), 矢野, 川西, 柏野, 大和,"超高精細分光撮影による祇園祭・山鉾懸装品のデジタルアーカイブ（第二報）", 人文科学とコンピュータ研究会シンポジウム（じんもんこん）2011, Dec.2011
内山, 出口, 井手, 村瀬､川西, 柏野,"市街地構造物への拡張現実型広告提示", ViEW2011ビジョン技術の実利用ワークショップ, Dec.2011
森, 内田, 坂野,"大局的構造情報を用いたオンライン数字認識"パターン認識・メディア理解研究会(PRMU), Nov.2011
村山,デイビス=ピーター,"ベルヌイ情報源の独立な計測系列の統合について",情報理論とその応用シンポジウム(SITA2011), Nov.2011
村山,デイビス=ピーター,"センシングと符号化とクラメールの定理", 第14回情報論的学習理論ワークショップ (IBIS2011), Nov.2011
橘, 亀岡, 小野, 嵯峨山,"スペクトログラムの滑らかさの異方性に基づく調波音・打楽器音分離の各手法の性能比較",音響学会秋季研究発表会, Sep.2011
村山,デイビス=ピーター,"センシングと符号化とデータ統合の数理",第24回回路とシステムワークショップ(ieice), Aug.2011
中野, ルルー, 亀岡, 中村, 小野, 嵯峨山,"スペクトログラムのベイジアンノンパラメトリックモデリングに基づく音楽信号の解析"音楽情報科学研究会, Jul.2011
三上, 大塚, 熊野, 大和,"Enhancing Memory-based Particle Filter with Detection-based Memory Acquisition for Robustness under Severe Occlusions."画像の認識・理解シンポジウム(MIRU2011), Jul.2011
亀岡,"チュートリアル：非負値行列因子分解", 音楽情報科学研究会, Jul.2011
ルルー=ジョナトン,"スペクトログラム矛盾性最大化と位相制御による音の転写 "音響学会春季研究発表会,Mar.2011
加古, 大石, 亀岡, 永野, 柏野, 武田,"合唱における歌声の基本周波数軌跡の分析",音響学会春季研究発表会, Mar.2011
亀岡,"Iダイバージェンスに基づく統計的音響信号処理の枠組に向けて", 音響学会春季研究発表会, Mar.2011
安良岡, 亀岡, 吉岡, 奥乃,"補助関数法を用いたIダイバージェンス規準残響抑圧", 音響学会春季研究発表会, Mar.2011
向井, 黒住, 平松, 川西, 永野, 柏野,"Content-Based Copy Detection タスク参加報告",パターン認識・メディア理解研究会(PRMU), Feb.2011
川西, 木村, 柏野, 佐藤, D.L.Duy, X.Wu, S.Poullot,"Instance Search タスク参加報告", パターン認識・メディア理解研究会(PRMU), Feb.2011
土田, 川西, 柏野, 大和, 田中, 矢野,"京都祇園祭における船鉾懸装品の超高精細分光画像撮影",マルチメディア・仮想環境基礎研究会(PRMU MVE IPSJ-CVIM), Jan.2011

2010

論文

福地、宮里、赤嶺、木村、高木、大和、柏野 "グラフコストの逐次更新を用いた映像顕著領域の自動抽出," 電子情報通信学会論文誌、Vol.J93-D, No.8, pp.1523-1532, Aug 2010.
K.Akamine K.Fukuchi A.Kimura S.Takagi,"Fully automatic extraction of salient objects from videos in near real-time."The Computer Journal.
U.Watchareeruetai, A.Kimura, C.Bao, T.Kawanishi, K,Kashino,"Interest point detection based on stochastically derived stability."､ISPJ Transaction

書籍、解説記事

A.Kimura, H.Kameoka, K.Kashino,"Media Scene Learning: A novel framework for automatically extracting meaningful parts from audio and video signals.",NTT Technical Review,Vol. 8 No. 11 Nov. 2010
M.Tsuchida, T.Kawanishi, J.Yamato,"High-resolution multiband imaging for accurate color reproduction.",NTT-Technical Review,Vol. 8 No. 11 Nov. 2010
木村, 亀岡, 柏野,"音や映像から「部品」を取り出すメディアシーン学習技術"NTT-技術ジャーナル誌(日本語),2010 Vol.22 №9,P15-18, Sep.2010
M.Mori,"Character Recognition", Sciyo『Character Recognition 』 Sep.2010
土田, 川西, 大和,"色を忠実に再現する高精細分光画像撮影技術", NTT技術ジャーナル誌(日本語), 2010 Vol.22 №9,P10-14, Sep.2010
土田勝,"超高精細度画像：10億画素で歴史的工芸品を記録する",アドコム・メディア『OplusE』2010年7月号（第368号）
亀岡,"音楽情報処理最前線！市販楽曲を自分好みの曲調に変えられるMusicFactorizer",寺島情報企画『DTMマガジン』2010年6月号, Jun.2010
熊野, 大塚, 大和, 前田, 佐藤,"頭部姿勢の変動に頑健な表情認識技術",日本工業出版『画像ラボ』解説記事

招待講演

木村昭悟,"人間の視覚的注意を予測するモデル：動的ベイジアンネットワークに基づく最新のアプローチ"信号処理シンポジウム, Nov.2010
大塚,"[招待講演] パーティクルフィルタとMCMC，そのコミュニケーション科学への応用", 情報理論研究会(IT), Nov.2010
亀岡,"[招待講演] 非負値行列因子分解入門～音響信号処理を題材として～", 部分空間法研究会, Jul.2010

国際会議予稿

M.Mori, K.Kashino,"Fast Template Matching Based on Normalized Cross Correlation Using Adaptive Block Partitioning and Initial Threshold Estimation.", ISM (International Symposium on Multimedia), Dec.2010
T.Maekawa, A.Kimura, H.Sakano "Wearable sensor device for automatic recording of hand drawings," Asian Confernece on Computer Vision (ACCV2010), November 2010.
S.Gorga, K.Otsuka,"Conversation Scene Analysis based on Dynamic Bayesian Network and Image-based Gaze Detection.", ICMI-MLMI201, Nov.2010
N.Kosugi,"Misual music visualization based on acoustic data.", iiWAS 2010, Nov.2010
T.Kawanishi, A.Kimura, K.Kashino, S.Sato, D.L.Duy, X.Wu, S.Poullot,"NTT Communication Science Laboratories and NII at TRECVID 2010 Instance Search Task.",TRECVID 2010, Nov.2010
R.Mukai, T.Kurozumi, K.Hiramatsu, T.Kawanishi, H.Nagano, K.Kashino,"NTT Communication Science Laboratories at TRECVID 2010 Content-Based Copy Detection.", TRECVID2010, Nov.2010
T.Nakano, A.Kimura, H.Kameoka, S.Miyabe, S.Sagayama, N.Ono, K.Kashino, T.Nishimoto,"NTT-UT TRECVID2010 Semantic Indexing and Known-Item Search.",TRECVID Workshop, Nov.2010
H.Kameoka, T.Yoshioka, M.Hamamura, J.Le Roux, K.Kashino,"Statistical Model of Speech Signals Based on Composite Autoregressive System with Application to Blind Source Separation.",LVA/ICA 2010, Sep.2010
K.Kashino,"Robust Media Search in the Cloud.", 13th German-Japanese Symposium(GJS2010), Sep.2010
J.Le Roux, H.Kameoka, N.Ono, S.Sagayama,"Fast signal reconstruction from magnitude STFT spectrogram based on spectrogram consistency."Internat. Conf. on Digital Audio Effects (DAFx),Sep 2010
J.Le Roux, E.Vincent, Y.Mizuno, H.Kameoka, N.Ono, S.Sagayama,"Consistent Wiener filtering: generalized time-frequency masking respecting spectrogram consistency.",LVA/ICA, Sep.2010
M.Nakano, J.L.Roux, H.Kameoka, Y.Kitano, N.Ono, S.Sagayama,"Nonnegative Matrix Factorization with Markov-chained Bases for Modeling Time-varying patterns in Music Spectrograms."LVA/ICA, Sep.2010
Y.Ohishi, H.Kameoka, D.Mochihashi, H.Nagano, K.Kashino,"Statistical Modeling of F0 Dynamics in Singing Voices Based on Second-order Linear System."Interspeech 2010, Sep.2010
H.Kameoka, J.Le Roux, Ohishi,"A Statistical Model of Speech F0 Contours.", 2010SAPA, Sep.2010
A.Kimura, H.Kameoka, M.Sugiyama, T.Nakano, E.Maeda, H.Sakano, K.Ishiguro "SemiCCA: Efficient semi-supervised learning of canonical correlations," Proc. IAPR International Conference on Pattern Recognition (ICPR 2010), pp. 2933-2936, August 2010.
M.Nakano, H.Kameoka, J.Le Roux, Y.Kitano, N.Ono, S.Sagayama,"CONVERGENCE-GUARANTEED MULTIPLICATIVE ALGORITHMS FOR NONNEGATIVE MATRIX FACTORIZATION WITH BETA-DIVERGENCE.", MLSP2010, Aug.2010
M.Tsuchida, T.Kawanishi, K.Ito, J.Yamato, T.Aoki,"Development of stereo-type one-shot multi-band camera system for accurate color reproduction.", ACM SIGGRAPH, Jul.2010
S.Kuzuoka, A.Kimura, T.Uyematsu "Universal source coding for multiple decoders with side information," Proc. of International Symposium on Information Theory (ISIT2010), pp. 1-5, June 2010.
M.Tsuchida, T.Kawanishi, J.Yamato, "Capturing and browsing Technology for Multiband Large Pixel-Number Pictures --- Giga-Pixels Accurate Colour Image Capturing System and Interactive Image Viewing Software ---", asiagraph2010, Jun.2010
H.Tanaka, K.Yano, K.Hachimura, T.Nishiura, W.Choi, T.Fukumori, K.Furukawa, W.Wakita, M.Tsuchida, N.Saiwaki,"Digital Archiving of the World Intangible Cultural heritage "Gion Festival in Kyoto": Reproduction of "Fune-boko" Float of the Gion Festival Parade in"Virtual Kyoto” ---", asiagraph2010, Jun.2010

その他会議予稿

木村, 南, 坂野, 前田, 杉山,"対話的映像認識理解における動的学習戦略に関する取り組み",パターン認識・メディア理解研究会(PRMU FM), Dec.2010
高木, 大石, 木村, 杉山, 山田, 亀岡,"半教師付き正準密度推定法に基づく音響信号の自動タグ付けと検索",パターン認識・メディア理解研究会(PRMU FM), Dec.2010
亀岡,"全極型声道モデルとF0パターン生成過程を内部にもつ統計的音声スペクトルモデル"信学会音声研究会, Nov.2010
大石, 亀岡, 持橋, 永野, 柏野,"線形2次系を利用した歌声のF0ダイナミクスの統計的モデル化と分析",信学会音声研究会, Nov.2010
中野, 木村, 亀岡, 宮部, 嵯峨山, 小野, 柏野, 西本,"モーダル間の共起関係を考慮した階層的トピック軌跡モデルによる映像認識検索",情報論的学習理論と機械学習研究会, Nov.2010
T.Nakano, A.Kimura, H.Kameoka, S.Miyabe, S.Sagayama, N.Ono, K.Kashino, T.Nishimoto,"Hierarchical topic trajectory model for video annotation retrieval considering cross-modal co-occurrences",IBISML2010, Nov.2010
森, 大和,"適応的領域分割と閾値推定を用いた高速テンプレートマッチング",パターン認識・メディア理解研究会(IBISML PRMU IPSJ-CVIM), Sep.2010
亀岡,"全極型声道モデルとF0パターン生成過程モデルを内部にもつ統一的音声生成モデル",音響学会秋季研究発表会, Sep.2010
大石, 亀岡, 持橋, 永野, 柏野,"複数振動基底に基づく歌声のF0動特性の統計的モデリング",音響学会秋季研究発表会,Sep.2010
加古, 大石, 亀岡, 永野, 柏野, 武田,"相平面確率モデルを利用した歌唱・楽器演奏の基本周波数軌跡の分析"音響学会秋季研究発表会, Sep.2010
濱村, 亀岡, 吉岡, ルルージョナトン, 柏野,"複合自己回帰系による音声パワースペクトル密度モデルを用いたブラインド音源分離と残響除去", 音響学会秋季研究発表会, Sep.2010
亀岡, ルルージョナトン, 大石,"音声F0パターン生成過程の確率モデル",音響学会秋季研究発表会, Sep.2010
ルルー, 亀岡, 小野, 嵯峨山,"スペクトログラム無矛盾性に基づく位相付加アルゴリズムにおける位相初期値選択による高速化の検討",音響学会秋季研究発表会,Sep.2010
蘇, 熊野, 大塚, 三上, 大和, 前田, 佐藤,"Subtle facial expression recognition based on category-dependent motion magnification.",FIT2010, Sep.2010
G.Sekhon, 木村, 南, 坂野, 前田,"保有知識の確信度に基づく対話型映像認識理解システムの質問生成戦略"パターン認識・メディア理解研究会(IBISML PRMU IPSJ-CVIM),Sep.2010
赤嶺、福地、木村、高木 "近実時間での映像顕著領域の自動抽出," 画像の認識・理解シンポジウム（MIRU2010）予稿集、Jul 2010.
G.Sekhon、福地、木村 "Automatic and precise extraction of generic objects using saliency-based priors and contour constraints," 画像の認識・理解シンポジウム（MIRU2010）予稿集，Jul 2010.
前川、木村、坂野 "ウェアラブルセンサを用いたお絵かきの記録," 画像の認識・理解シンポジウム（MIRU2010）予稿集、Jul 2010.
木村、中野、杉山、亀岡、前田、坂野 "SSCDE: 画像認識検索のための半教師付正準密度推定法," 画像の認識・理解シンポジウム（MIRU2010）予稿集、Jul 2010（MIRU2010 インタラクティブセッション賞受賞）．
U.Watchareeruetai、木村、C.Bao、川西、柏野 "StochasticSIFT: Interest point detection based on stochastically-derived stability," 画像の認識・理解シンポジウム（MIRU2010）予稿集，Jul 2010．
土田, 川西, 大和, 伊藤, 青木,"色再現を目的としたステレオ式ワンショット６バンド撮影システム",画像の認識・理解シンポジウム(MIRU2010), Jul.2010
大石, 亀岡, 持橋, 永野, 柏野,"Vocal Dynamics Controller: 歌声のF0 動特性を音高単位で編集し，合成できるインタフェース",音楽情報科学研究会, Jul.2010

2009

論文

熊野, 大塚, 大和, 前田, 佐藤, 「パーティクルフィルタとこう配法の組み合わせによる頭部姿勢と表情の同時推定」, 電子情報通信学会論文誌 D, Vol. J92-D, No. 8, pp. 1349--1362, , 2009.
S. Kumano, K. Otsuka, J. Yamato, E. Maeda, and Y. Sato, “Pose-Invariant Facial Expression Recognition Using Variable-Intensity Templates”, International Journal of Computer Vision, Vol. 83, Issue 2, pp. 178--194, Jun. 2009.
A. Kimura, T. Uyematsu, S. Kuzuoka and S. Watanabe, "Universal source coding over generalized complementary delivery networks," IEEE Transactions on Information Theory, Vol.55, No.3, pp. 1360--1373, Mar. 2009.

書籍、解説記事

柏野, "音響指紋技術とその応用 " 日本音響学会誌, 2009
大塚，荒木：「会話シーン分析のための音声映像技術」，NTT技術ジャーナル， May. 2009，（特集：コミュニケーション科学の融合研究における新潮流） https://journal.ntt.co.jp/backnumber2/0905/files/jn200905017.pdf
大塚：「コミュニケーション科学の創造・発展を目指して」，NTT技術ジャーナル（主役登場）， May. 2009，https://journal.ntt.co.jp/backnumber2/0905/files/jn200905021.pdf
K. Otsuka and S. Araki, “Audio-Visual Technology for Conversation Scene Analysis”, NTT Technical Review, Vol. 7, No. 2, Feb. 2009

招待講演

柏野, "音や映像から情報を引き出す " 国立情報学研究所軽井沢懇話会, Jul 2009
葛岡, 木村, 渡辺, "Perspectives on multiterminal source coding: Distributed encoding, distributed decoding and their applications" 情報理論とその応用シンポジウムワークショップ, Dec 2009
大塚, "人と人とのコミュニケーションを理解する～マルチモーダル情報処理による会話シーン分析～ " ビジョン技術の実利用ワークショップ, Dec 2009
亀岡, "スパース表現による音響信号処理 " 情報論的学習理論ワークショップ, Oct 2009

国際会議予稿

Kumano, Otsuka, Mikami, Yamato, "Recognizing Communicative Facial Expressions for Discovering Interpersonal Emotions in Group Meetings " ICMI, Nov 2009
Miyazato, Kimura, Takagi, Yamato, "Real-time estimation of human visual attention with MCMC-based paritcle filter " ICME, Jul 2009
Fukuchi, Miyazato, Kimura, Takagi, Yamato, "Saliency-based video segmentation with graph cuts and sequentially update priors " ICME, Jul 2009
Kimura, Kashino, Fukuchi, Miyazato, Akamine, Takagi, "Towards cognitive developmental approach to visual scene understanding: Framework and core technologies " IEEE International Workshop on Computer Vision for Humanoid Robots, Sep 2009
Mikami, Otsuka, Yamato, "Memory-based particle filter for face pose tracking under complex dynamics " CVPR, Jun 2009
Kameoka, Nakatani, Yoshioka, "Robust speech dereverberation based on non-negativity and sparse nature of speech spectrograms" ICASSP, Apr 2009
Kameoka, Ono, Kashino, Sagayama, "Complex NMF: A new sparse representation for acoustic signals" ICASSP, Apr 2009
Kameoka, Kashino, "Composite autoregressive system for sparse source-filter representation of speech" ISCAS, May 2009
T. Yoshioka, H. Kameoka, T. Nakatani, and H. G. Okuno, "Statistical Models for Speech Dereverberation,”to appear in Proc. 2009 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA 2009), Oct. 2009.
T. Kako, Y. Ohishi, H. Kameoka, K. Kashino and K. Takeda , "Automatic Identification for Singing Style Based on Sung Melodic Contour Characterized in Phase Plane," to appear in Proc. International Conference on Music Information Retrieval, (ISMIR 2009)
S. Kumano, K. Otsuka, D. Mikami and J. Yamato, "Recognizing Communicative Facial Expressions for Discovering Interpersonal Emotions in Group Meetings", to appear in Proc. International Conference on Multimodal Interfaces (ICMI), Sep. 2009.
K. Ishizuka, S. Araki, K. Otsuka, T. Nakatani, M. Fujimoto, “A Speaker Diarization based on the Probabilistic Fusion of Audio-Visual Location Information”, to appear in Proc. ACM ICMI-MLMI2009
Y. Minami, H. Kameoka, "Switching Acausal Filters for Speech Modeling," to appear in Proc. 2009 IEEE International Workshop on Machine Learning for Signal Processing (Formerly the IEEE Workshop on Neural Networks for Signal Processing)
K. Fukuchi, K. Miyazato, A. Kimura, S. Takagi and J. Yamato "Saliency-based video segmentation with graph cuts and sequentially-updated priors," in Proc. International Conference on Multimedia and Expo (ICME2009), pp. 638--641, New York, New York, USA, Jun.-Jul. 2009.
K. Miyazato, A. Kimura, S. Takagi and J. Yamato "Real-time estimation of human visual attention with MCMC-based particle filter," in Proc. International Conference on Multimedia and Expo (ICME2009), pp. 250--257, New York, New York, USA, Jun.-Jul. 2009.
D. Mikami, K. Otsuka, and J. Yamato, “Memory-based particle filter for face pose tracking robust under complex dynamics”, in Proc. IEEE Conference on Computer Vision and Pattern Recognition 2009 (CVPR2009), Oral Presentation (acceptance rate=4.1%)
H. Kameoka, K. Kashino , "Composite Autoregressive System for Sparse Source-Filter Representation of Speech," in Proc. 2009 IEEE International Symposium on Circuits and Systems (ISCAS2009), pp. 2477--2480, 2009.
H. Kameoka, N. Ono, K. Kashino , S. Sagayama, "Complex NMF: A New Sparse Representation for Acoustic Signals," in Proc. 2009 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2009), pp. 3437--3440, 2009.
H. Kameoka, T. Nakatani, T. Yoshioka, "Robust Speech Dereverberation Based on Non-negativity and Sparse Nature of Speech Spectrograms," in Proc. 2008 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2009), pp. 45--48, 2009.

その他会議予稿

ルルー, 亀岡, 小野, 嵯峨山, "スペクトログラムの無矛盾性と位相復元への応用 " 情報処理学会音楽情報科学研究会, Jul 2009
伊藤, 安藤, ルルー, 中野, 吉井, "新博士によるパネルディスカッションIII「私のための研究・価値を生み出す研究」 " 情報処理学会音楽情報科学研究会, Jul 2009
ルルー, 亀岡, ヴィンセント, 小野, 柏野, 嵯峨山, "無矛盾性拘束付き複素NMF " 音響学会秋季研究発表会, Sep 2009
宮里, 木村, 高木, 大和, "MCMC-based particle filterを用いた人間の映像視聴行動の実時間推定 " 画像の認識・理解シンポジウム, Jul 2009
福地, 宮里, 木村, 高木, 大和, "グラフコストの逐次更新を用いた映像顕著領域の自動抽出 " 画像の認識・理解シンポジウム, Jul 2009
宮里, 木村, 高木, 大和, "MCMC-based particle filter を用いた人間の映像注視行動の実時間推定 " 電子情報通信学会パターン認識・メディア理解研究会, May 2009
福地, 宮里, 木村, 高木, 大和, "グラフコストの逐次更新を用いた映像顕著領域の自動抽出 " 電子情報通信学会パターン認識・メディア理解研究会, May 2009
葛岡, 木村, 植松, "Universal source coding for multiple decoders with side information " シャノン理論ワークショップ, Sep 2009
木村, 亀岡, 杉山, 前田, 坂野, 石黒, "SemiCCA: Efficient semi-supervised learning of canonical correlations " 情報論的学習理論ワークショップ, Oct 2009
木村, 柏野, 福地, 宮里, 赤嶺, 高木, "映像認識理解への認知発達的アプローチ " 電子情報通信学会パターン認識・メディア理解研究会, Dec 2009
橋本, 村田, 鳥居, 長野, 田中, 矢野, "超高精細分光撮影による祇園祭・山鉾懸装品のデジタルアーカイブ " じんもんこん, Dec 2009
三上, 大塚, 大和, "顔姿勢追跡のための複雑ダイナミクスに頑健なメモリベースパーティクルフィルタ " 画像の認識・理解シンポジウム, Jul 2009
笠井, 原田, 大島, 高宮, "ヴィジュアル言語Viscuitを利用した連続ワークショップ " 日本デザイン学会秋季研究発表会, Jun 2009
森, 萩田, 古谷, 古谷, 松岡, "診断サポートに向けた臨床データの健康度推定 " 電子情報通信学会全国大会, Mar 2009
萩田, 篠沢, 森, 塚原, 阿部, 松岡, 古谷, 古谷, 斉藤, "統合医科学データベース・プロトタイプシステムの開発 " IREIIMS公開シンポジウム, Feb 2009
石川, 大塚, 斎藤, 日浦, 労, 岡谷, "CVPR2009報告 " 情報処理学会コンピュータビジョンとイメージメディア研究会, Nov 2009
黒住, 川西, 向井, 柏野, 大和, "頻出映像検出システム～映像ナビゲーションへの適用～" 画像の認識・理解シンポジウム, Jul 2009
亀岡, 柏野, "複合自己回帰系に基づく音響信号の生成モデル " 音響学会春季研究発表会, Mar 2009
北野, 亀岡, 柏野, 小野, 嵯峨山, "複素NMFDによる音声抽出マスクの設計と背景音楽抑圧への応用 " 音響学会春季研究発表会, Mar 2009
亀岡, ルルー, 大石, 柏野, "Music Factorizer: 音楽音響信号をノート単位で編集できるインタフェース " 情報処理学会音楽情報科学研究会, Jul 2009
亀岡, ルルー, "Frobeniusノルム規準の非負値行列因子分解における乗法更新式に関する一考察 " 音響学会秋季研究発表会, Sep 2009
北野, 亀岡, 和泉, 小野, 嵯峨山, "音源信号のスパース基底モデルに基づくブラインド音源分離の検討 " 音響学会秋季研究発表会, Sep 2009
J. Le Roux, H. Kameoka, E. Vincent, N. Ono, K. Kashino and S. Sagayama, "Complex NMF under spectrogram consistency constraints," in Proc. ASJ Autumn Meeting, 2-4-5, Sep. 2009.
S. Kuzuoka, A. Kimura and T. Uyematsu, "Universal source coding for multiple decoders with side information," to appear in Proc. Shannon Theory Workshop (STW2009, domestic), Matsuyama, Ehime, Japan, Sep. 2009.
亀岡, ルルー, 大石, 柏野, "Music Factorizer: 音楽音響信号をノート単位で編集できるインタフェース," 情報処理学会研究報告, 2009-MUS-81-9, 2009.
ルルー, 亀岡, 小野, 嵯峨山, "スペクトログラムの無矛盾性と位相復元への応用," 情報処理学会研究報告, 2009-MUS-81-8, 2009.
加古, 大石, 亀岡, 柏野, 武田, "相平面に描かれるF0の動的変動成分を利用した歌唱様式の自動分類," 情報処理学会研究報告, 2009-MUS-81-4, 2009.
J. Le Roux, H. Kameoka, N. Ono and S. Sagayama, "Spectrogram consistency and its application to phase reconstruction," in Proc. IPSJ SIGMUS Summer Workshop, 2009-MUS-81-8, Jul. 2009.
福地、宮里、木村、高木、大和、柏野 ”グラフコストの逐次更新を用いた映像顕著領域の自動抽出”、画像の認識・理解シンポジウム (MIRU2009)予稿集、 OS5-4、島根県松江市、2009年7月
宮里、木村、高木、大和、柏野 ”MCMC-based particle filterを用いた人間の映像注視行動の実時間推定”、画像の認識・理解シンポジウム (MIRU2009)予稿集、 OS5-3、島根県松江市、2009年7月
三上、大塚、大和 ”頑健な顔姿勢追跡のための状態履歴の記憶に基づくパーティクルフィルタ”、画像の認識・理解シンポジウム (MIRU2009)予稿集、 OS3-1、島根県松江市、2009年7月
黒住，川西，向井，柏野，大和, ``頻出映像検出システム～映像ナビゲーションへの適用～'', 画像の認識・理解シンポジウム(MIRU2009)予稿集, DS-2, pp. 1861--1862, Jul. 2009.
石塚，荒木，大塚，中谷，藤本，「音響情報と映像情報から得られる位置情報の統合による話者ダイアライゼーション」，日本音響学会2009年春季研究発表会, 2009.(2009年3月19日発表).
小笠原，石塚，荒木，藤本，中谷，大塚，「SN比最大化ビームフォーマを用いたオンライン会議音声強調」，日本音響学会2009年春季研究発表会, 2009.( 2009年3月17日発表).
森，萩田，古谷，古谷，松岡,”診断サポートに向けた臨床データの健康度推定,” 2009電子情報通信学会総合大会, Mar. 2009.
亀岡, 柏野, “複合自己回帰系に基づく音響信号の生成モデル,” 日本音響学会2009年春季研究発表会講演論文集, 2-9-8, pp. 671--674, 2009.
南, 亀岡, “Switching Acausal Filter (SAF) の提案,” 日本音響学会2009年春季研究発表会講演論文集, 2-5-15, pp. 83--84, 2009.
北野, 亀岡, 柏野, 小野, 嵯峨山 “複素NMFDによる音声抽出マスクの設計と背景音楽抑圧への応用,” 日本音響学会2009年春季研究発表会講演論文集, 3-9-6, pp. 719--720, 2009.

2008

論文

亀岡, 鎌本, 原田, 守谷, "予測誤差のGolomb-Rice符号量を最小化する線形予測分析," 電子情報通信学会論文誌, Vol. J91-A, No. 11, pp. 1017--1025, 2008.
O. Lozano and K. Otsuka, “Real-time visual tracker by Stream processing ---Simultaneous and fast 3D tracking of multiple faces in video sequences by using a particle filter ---,” Journal of VLSI Signal Processing Systems (Freely downloadable from https://doi.org/10.1007/s11265-008-0250-2 )
S. Saito, H. Kameoka, K. Takahashi, T. Nishimoto, S. Sagayama, "Specmurt Analysis of Polyphonic Music Signals," IEEE Transactions on Audio, Speech and Language Processing, Vol. 16, No. 3, pp. 639--650, 2008.
A. Kimura, K. Kashino , T. Kurozumi and H. Murase, "A quick search method for audio signals based on piecewise linear representation of feature trajectories," IEEE Transactions on Audio, Speech and Language Processing, Vol.16, No.2, pp. 396--407, Feb. 2008.
熊野, 大塚, 大和, 前田, 佐藤, 「変動輝度テンプレートによる頭部姿勢と表情の同時推定」, 情報処理学会論文誌コンピュータビジョンとイメージメディア, Vol. 1, No. 2, pp. 50--60, 2008.

書籍、解説記事

嵯峨山, 亀岡, "自動採譜技術の展望," (解説論文), 日本音響学会誌, Vol.64, No.12, pp. 715--720, 2008.
大塚，荒木，「コミュニケーションを理解する音声・映像技術」，ITUジャーナル，Vol. 38, No, 8, pp. 5--7, 2008年8月号
ダウニー, (訳)亀岡, "音楽情報検索コンテスト(2005～2007)を通して見た音楽情報検索研究," (解説論文), 日本音響学会誌, Vol.64, No.8, pp. 457--467, 2008.
柏野, 亀岡, “見つけたい情報を的確に見つけ出すメディア検索技術,” ITUジャーナル, Vol. 38 No. 8, pp. 8--9, 2008.
柏野, 向井, 大塚, 永野, 泉谷, 木村, 黒住, 大和:　"高速メディア探索",　ＮＴＴ技術ジャーナル, vol.19, no.6, pp. 29--32 (Jul. 2008).

招待講演

大塚, "画像認識に基づくコミュニケーションシーンの分析・理解 " 計測自動制御学会, Dec 2008
大塚, 第9回計測自動制御学会（SICE）システムインテグレーション部門講演会基調講演「画像認識に基づくコミュニケーションシーンの分析・理解」(2008年12月5日）
後藤, 亀岡, 北原, 平賀, 緒方, 戸田, 武田, “合同特別企画: パネルディスカッション「“音”研究の未来」,”(パネルディスカッション), 情報処理学会研究報告, 2008-MUS-74(2008-SLP-70), pp. 57--58, 2008.

国際会議予稿

Kimura, Pang, Takeuchi, Yamato, Kashino, "Dynamic Markov random fields for stochastic modeling of visual attention " ICPR, Dec 2008
A. Kimura, D. Pang, T. Takeuchi, J. Yamato and K. Kashino "Dynamic Markov random fields for stochastic modeling of visual attention," in Proc. International Conference on Pattern Recognition (ICPR2008), Mo.BT8.35, Tampa, Florida, USA, Dec. 2008.
M. Mori, M. Sawaki, J. Yamato,“Robust character recognition using adaptive feature extraction,” 23th International Conference Image and Vision Computing New Zealand, Christchurch, NZ, Nov. 2008.
K. Otsuka, S. Araki, K. Ishizuka, M. Fujimoto, M. Heinrich, and J. Yamato, "A Realtime Multimodal System for Analyzing Group Meetings by Combining Face Pose Tracking and Speaker Diarization", in Proc. ACM 10th Int. Conf. Multimodal Interfaces (ICMI2008) , pp. 257--264 , 2008
J. Le Roux, H. Kameoka, N. Ono, A. de Cheveigne, S. Sagayama, "Computational Auditory Induction by Missing-Data Non-Negative Matrix Factorization," in Proc. SAPA 2008 Workshop on Statistical and Perceptual Audition (SAPA 2008), in CD-ROM, Sep. 2008.
Y. Ohishi, H. Kameoka, K. Kashino , K. Takeda , "Parameter Estimation Method of F0 Control Model for Singing Voices," in Proc. Interspeech2008 International Conference on Spoken Language Processing (ICSLP2008), pp. 139--142, Sep. 2008.
N. Ono, K. Miyamoto, H. Kameoka, S. Sagayama, "A Real-time Equalizer of Harmonic and Percussive Components in Music Signals," in Proc. Ninth International Conference on Music Information Retrieval (ISMIR2008), pp. 139--144, Sep. 2008.
T. Izumitani and K. Kashino, "A Robust Musical Audio Search Method Based on Diagonal Dynamic Programming Matching of Self-Similarity Matrices," Ninth International Conference on Music Information Retrieval (ISMIR2008), pp. 609--613, Sep. 2008.
K. Otsuka and J. Yamato, “Fast and Robust Face Tracking for Analyzing Multiparty Face-to-Face Meetings”, 5th Joint Workshop on Machine Learning and Multimodal Interaction (MLMI2008) , Lecture Notes in Computer Science, Vol. 5237, pp. 14--25, 2008.
S. Kumano , K. Otsuka, J. Yamato, E. Maeda and Y. Sato, "Combining Stochastic and Deterministic Search for Pose-Invariant Facial Expression Recognition", in Proc. British Machine Vision Conference (BMVC), 2008.
N. Ono, K. Miyamoto, J. Le Roux, H. Kameoka, S. Sagayama, "Separation of a Monaural Audio Signal into Harmonic/Percussive Components by Complementary Diffusion on Spectrogram," in Proc. 2008 16th European Signal Processing Conference (EUSIPCO 2008), in CD-ROM, Aug. 2008.
S. Kuzuoka, A. Kimura and T. Uyematsu "Universal coding for lossy complementary delivery problem," in Proc. International Symposium on Information Theory (ISIT2008), pp. 2177--2181, Toronto, Canada, Jul. 2008.
D. Pang, A. Kimura, T. Takeuchi, J. Yamato and K. Kashino "A stochastic model of selective visual attention with a dynamic Bayesian network," in Proc. International Conference on Multimedia and Expo (ICME2008), pp. 1073--1076, Hannover, Germany, Jun. 2008.
T. Izumitani, R. Mukai, and K. Kashino, "A Background Music Detection Method Based on Robust Feature Extraction," IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2008), pp. 13--16, Apr. 2008.
H. Kameoka, N. Ono, S. Sagayama, "Auxiliary Function Approach to Parameter Estimation of Constrained Sinusoidal Model for Monaural Speech Separation," in Proc. 2008 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2008), pp. 29--32, Mar. 2008.
J. Le Roux, H. Kameoka, N. Ono, S. Sagayama, A. de Cheveigne, "Modulation Analysis of Speech through Orthogonal FIR Filterbank Optimization," in Proc. 2008 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2008), pp. 4189--4192, Mar. 2008.
K. Miyamoto, H. Kameoka, T. Nishimoto, N. Ono, S. Sagayama, "Harmonic-Temporal-Timbral Clustering (HTTC) for the Analysis of Multi-instrument Polyphonic Music Signals," in Proc. 2008 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2008), pp. 113--116, Mar. 2008.
O. Lozano and K. Otsuka, “Simultaneous and Fast 3D Tracking of Multiple Faces in Video by GPU-based Stream Processing”, in Proc. IEEE ICASSP2008(The 33rd International Conference on Acoustics, Speech, and Signal Processing), pp. 713--716, 2008 http://www.springerlink.com/content/pk22n1632859082k/

その他会議予稿

大塚, 荒木, 石塚, 藤本, 大和, "多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 " 電子情報通信学会マルチメディア・仮想環境基礎研究会, Nov 2008
石塚, 荒木, 大塚, 藤本, 中谷：「音響情報と映像情報の統合による多人数会話における話者決定技術」，情報処理学会第74回音声言語情報処理研究会 (SIG-SLP) ，Vol.2008, No.123, pp. 25--30，2008年12月
A. Kimura, D. Pang, T. Takeuchi, J. Yamato and K. Kashino , "Dynamic Markov random fields for stochatic modeling of visual attention," IEICE Technical Report (domestic), PRMU2008-117 (MVE2008-66), Toyonaka, Osaka, Japan, Nov. 2008.
A. Kimura, "Particle-based simulation of the Gel'fand-Pinsker channel capacity and the Wyner-Ziv rate-distortion function," in Proc. Symposium on Information Theory and its Applications (SITA2008, domestic), pp. 200--203, Kinugawa, Tochigi, Japan, Oct. 2008.
亀岡, 小野, 柏野, 嵯峨山, “複素NMF: 新しいスパース信号分解表現と基底系学習アルゴリズム,” 日本音響学会2008年秋季研究発表会講演論文集, 2-8-13, pp. 657--660, 2008.
亀岡, 中谷, 吉岡, “音声のスパース性と非負制約つき畳み込みモデルに基づくパワースペクトル領域残響除去,” 日本音響学会2008年秋季研究発表会講演論文集, 3-8-10, pp. 705--708, 2008.
大石, 亀岡, 柏野, 武田, “Convolutive HMMに基づく歌声の基本周波数制御モデルの提案とそのパラメータ最尤推定,” 日本音響学会2008年秋季研究発表会講演論文集, 1-Q-25, pp. 379--382, 2008.
宮本, 亀岡, 小野, 嵯峨山, “Source-Filterモデルを含めた調波構造・時間包絡・音色の統合的クラスタリング(HTTC)による楽音分析,” 日本音響学会2008年秋季研究発表会講演集, 2-5-10, pp. 907--908, 2008.
大石, 亀岡, 柏野, 武田, "畳み込みHMMに基づく歌声の基本周波数制御モデルの提案とそのパラメータ学習方法," 情報処理学会研究報告, 2008-MUS-76, pp. 89--96, 2008.
森，澤木，大和“カテゴリ依存特徴抽出法と映像中文字認識への応用,”画像情報学フォーラム第11回画像の認識・理解シンポジウム, Jul. 2008.
D. Pang, A. Kimura, T. Takeuchi, J. Yamato and K. Kashino "A stochastic model of selective visual attention with a dynamic Bayesian network," in Proc. Meeting on Image Recognition and Understanding (MIRU2008, domestic), pp. 1500--1505, Karuizawa, Nagano, Japan, Jul. 2008. (Selected as Best Interactive Session Award )
熊野, 大塚, 大和, 前田, 佐藤, 「パーティクルフィルタと勾配法の組み合わせによる頭部姿勢変動に頑健な表情認識手法」, 画像の認識・理解シンポジウム(MIRU), 2008.
亀岡, 柏野, “複合ソースフィルタモデルによる音響信号の三要素テンソル分解,” 電子情報通信学会2008年総合大会講演論文集, AS-5-5, pp. S-56--S-57, 2008.
鎌本, 亀岡, 原田, 守谷, “補助関数法によるL1ノルム規準の線形予測分析法の収束性に関する検討,” 日本音響学会2008年春季研究発表会講演論文集, 1-11-18, pp. 281--284, 2008.
松本, 亀岡, 小野, 嵯峨山, “ウェーブレット変換領域における擬似周期信号重畳モデルの瞬時パラメータ推定と音源分離への応用,” 日本音響学会2008年春季研究発表会講演論文集, 3-6-6, pp. 719--722, 2008.
宮本, ルルー, 亀岡, 小野, 嵯峨山, “スペクトログラムの滑らかさの異方性に基づく調波音・打楽器音の分離,” 日本音響学会2008年春季研究発表会講演集, 2-5-8, pp. 903--904, 2008.

2007

論文

A. Kimura, T. Uyematsu and S. Kuzuoka, "Universal coding for correlated sources with complementary delivery," IEICE Transactions on Fundamentals, Vol.E90-A, No.9, pp. 1840--1847, Sep. 2007. Pulished online in IEICE Transaction Online.
熊野, 大塚, 大和, 前田, 佐藤, 「変動輝度テンプレートを用いた頭部姿勢変動に頑健な確率的表情認識手法」, 情報科学技術レターズ, pp. 215--218, 2007.
黒住，永野，柏野, ``実環境で収録された映像断片をキーとする一致映像探索'', 電子情報通信学会論文誌 D-II, VOL.J90-D, No.8, pp. 2223--2231, Aug. 2007.
J. Le Roux, H. Kameoka, N. Ono, A. de Cheveigne and S. Sagayama, "Single and Multiple Pitch Contour Estimation through Parametric Spectrogram Modeling of Speech in Noisy Environments," IEEE Transactions on Audio, Speech and Language Processing, Vol. 15, No. 4, pp. 1135--1145, May. 2007.
H. Kameoka, T. Nishimoto, S. Sagayama, "A Multipitch Analyzer Based on Harmonic Temporal Structured Clustering," IEEE Transactions on Audio, Speech and Language Processing, Vol. 15, No. 3, pp. 982--994, Mar. 2007.

書籍、解説記事

柏野, 向井, 大塚, 永野, 泉谷, 木村, 黒住, 大和, "高速メディア探索", NTT技術ジャーナル, Jun. 2007.

招待講演

大塚, 非言語知識研究会第3回研究会「非言語行動の観測に基づく対面会話シーンの認識・理解」愛知県産業貿易館西館６階, 2007年12月5日
大塚, 電子情報通信学会第12回ヴァーバル・ノンヴァーバル・コミュニケーション研究会「ノンバーバル行動に基づく会話構造の確率的推論 ―対面会話シーンの自動的な認識・理解に向けて―」，東京大学本郷キャンパス，2007年11月30日
平田, 梶, 亀岡, 北原, 齋藤, 武田, 橋田, “新博士によるパネルディスカッション1「博士への道のりと将来の夢」,” (パネルディスカッション), 情報処理学会研究報告, 2007-MUS-71-7, pp. 39--42, 2007.

国際会議予稿

K. Otsuka, H. Sawada, and J. Yamato, "Automatic Inference of Cross-modal Nonverbal Interactions in Multiparty Conversations", in Proc. ACM 9th Int. Conf. Multimodal Interfaces (ICMI2007), pp. 255--262, Nov. 2007.(Outstanding Paper Award)
S. Kumano, K. Otsuka, J. Yamato, E. Maeda, and Y. Sato, "Pose-Invariant Facial Expression Recognition Using Variable-Intensity Templates," in Proc. 8th Asian Conference on Computer Vision (ACCV2007), Part I, LNCS Vol. 4843, pp. 324--334, 2007(Honorable Mention)
J. Le Roux, H. Kameoka, N. Ono, A. de Cheveigne, S. Sagayama, "Single Channel Speech and Background Segregation through Harmonic-Temporal Clustering," in Proc. 2007 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA2007), pp. 279--282, Oct. 2007.
T. Izumitani and K. Kashino, "A Musical Audio Search Method Based on Self-Similarity Features", International Conference on Multimedia & Expo (ICME2007), Jul. 2007.
C. Leung, A. Kimura, T. Takeuchi and K. Kashino "A computational model of saliency depletion/recovery phenomena for the salient region extraction of videos," in Proc. International Conference on Multimedia and Expo (ICME2007), pp. 300--303, Beijing, China, Jul. 2007.
A. Kimura, T. Uyematsu and S. Kuzuoka, "Universal coding for correlated sources with complementary delivery," in Proc. International Symposium on Information Theory (ISIT2007), pp. 1756--1760, Nice, France, Jun. 2007.
K. Kashino , A. Kimura, H. Nagano, and T. Kurozumi : "Robust Search Methods for Music Signals Based on Simple Representation", in Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP), vol.IV, pp. 1421--1424 (Apr. 2007).
K. Miyamoto, H. Kameoka, H. Takeda, T. Nishimoto, S. Sagayama, "Probabilistic Approach to Automatic Music Transcription from Audio Signals," in Proc. 2007 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2007), Vol. 2, pp. 697--700, Apr. 2007.

その他会議予稿

A. Kimura, T. Uyematsu and S. Kuzuoka, "Universal coding for correlated sources over generalized complementary delivery networks," in Proc. Symposium on Information Theory and its Applications (SITA2007, domestic).
S. Kuzuoka, A. Kimura and T. Uyematsu, "Simple coding schemes for lossless and lossy complementary delivery problems," in Proc. Shannon Theory Workshop (STW2007, domestic), pp. 43--50, Izu, Shizuoka, Japan, Sep. 2007.
亀岡, 鎌本, 原田, 守谷, “残差ベクトルのL1ノルムを最小化する線形予測分析の解法,” 日本音響学会2007年秋季研究発表会講演論文集, 2-7-20, pp. 707--710, 2007.
ルルー, 亀岡, 小野, ドゥシュベニエ, 嵯峨山, “パワースペクトルの調波時間構造化クラスタリングによるモノラル音声分離,” 日本音響学会2007年秋季研究発表会講演論文集, 3-4-3, pp. 351--352, 2007.
ルルー, 亀岡, 小野, 嵯峨山, ドゥシュベニエ, “音響信号の振幅変調分析のためのフィルタバンク最適化,” 日本音響学会2007年秋季研究発表会講演論文集, 1-2-1, pp. 483--484, 2007.
宮本, 亀岡, 西本, 小野, 嵯峨山, “調波構造・時間包絡・音色の統合的クラスタリング(HTTC)による複数楽器音楽信号の楽音分析,” 日本音響学会2007年秋季研究発表会講演集, 1-1-6, pp. 823--824, 2007.
宮本, 立薗, ルルー, 亀岡, 小野, 嵯峨山, “スペクトログラム2次元フィルタによる調波音・打楽器音の分離,” 日本音響学会2007年秋季研究発表会講演論文論文集, 1-1-7, pp. 825--826, 2007.
熊野, 大塚, 大和, 前田, 佐藤, 「表情認識のための変動輝度テンプレートとその頭部姿勢変動に対する頑健性の一検討」, コンピュータビジョンとイメージメディア研究報告, Vol. 2007, No. 87, pp. 145--152, 2007.
宮本, 亀岡, 西本, 小野, 嵯峨山, "調波構造・時間包絡・音色の統合的クラスタリングによる楽音分析," 情報処理学会研究報告, 2007-MUS-71-25, pp. 155--160, 2007. 〈ベストプレゼンテーション賞受賞〉
米林, 亀岡, 嵯峨山, "手の自然な動きを考慮した隠れ変数付き隠れマルコフモデルに基づくピアノ運指決定," 情報処理学会研究報告, 2007-MUS-71-29, pp. 179--184, 2007.
C. Leung, A. Kimura, T. Takeuchi and K. Kashino "A computational model of saliency depletion/recovery phenomena for the salient region extraction of videos," in Proc. Meeting on Image Recognition and Understanding (MIRU2007, domestic), pp. 582--587, Hiroshima, Japan, Jul. 2007.
熊野, 大塚, 大和, 前田, 佐藤, 「変動輝度テンプレートを用いた頭部姿勢変動に頑健な表情認識手法」, 画像の認識・理解シンポジウム(MIRU), 2007.
O. Lozano and K. Otsuka, "Simultaneous Real-time 3D Visual Tracking of Multiple Objects using a Stream Processor," 画像の認識・理解シンポジウム（MIRU2007）DS-01 (2007)
澤田, 荒木, 大塚, 藤本, 石塚, 「多人数マイクでの発話区間検出 - ピンマイクでの事例 -」，日本音響学会講演論文集, 3-Q-15, 春季, 2007.

2006

論文

大塚, 竹前, 大和，村瀬：「複数人物の対面会話を対象としたマルコフ切替モデルに基づく会話構造の確率的推論」，情報処理学会論文誌，Vol. 47, No. 7, pp. 2317--2334, 2006.
Y. Takemae, K. Otsuka, J. Yamato, and S. Ozawa, "The Subjective Evaluation Experiments of an Automatic Video Editing System Using Vision-based Head Tracking for Multiparty Conversations," IEEJ Trans. Electronics, Information and Systems, Vol. 126-C, No. 4, pp. 435--442, Apr. 2006.

書籍、解説記事

K. Kashino : "Auditory Scene Analysis in Music Signals", A. Klapuri and M. Davy (eds.): Signal Processing Methods for Music Transcription, pp. 299--325 (May. 2006).
柏野: "音楽や映像の高速探索", 情報処理, vol.47, no.4 (Apr. 2006).

招待講演

大塚, 人工知能学会研究会第48回言語・音声理解と対話処理研究会 (SIG-SLUD), 「非言語行動の観測に基づく複数人物の会話シーン分析」, No. SIG-SLUD-A602-01, pp. 1--6, Nov. (2006)

国際会議予稿

K. Kashino : "Music Recognition for Broadcasting Programs Using Media Search Technology", CISAC（著作権協会国際連合）会議 (Oct. 2006).
A. Kimura and T. Uyematsu, "Multiterminal source coding with complementary delivery," in Proc. International Symposium on Information Theory and Its Applications (ISITA2006), pp. 189--194, Seoul, South Korea, Oct. 2006.
T. Izumitani and K. Kashino, "Frequency Component Restoration for Music Sounds Using Local Probabilistic Models with Maximum Entropy Learning", ISCA Tutorial and Research Workshop on Statistical and Perceptual Audition (SAPA 2006), pp. 12--17, Sep. 2006.
C. Chen, T. Kurozumi , and J. Yamato, ``Poster Image Matching by Color Scheme and Layout Information'', in Proc. ICME2006, Jul. 2006.
K. Otsuka, J. Yamato, Y. Takemae, and H. Murase, "Conversation Scene Analysis with Dynamic Bayesian Network Based on Visual Head Tracking,", in Proc. ICME'06, Jul. 2006.
T. Izumitani and K. Kashino, "Frequency Component Restoration for Music Sounds Using a Markov Random Field and Maximum Entropy Learning", IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2006), pp. V257--V260, May. 2006.
K. Otsuka, J. Yamato, Y. Takemae, and H. Murase, "Quantifying Interpersonal Influence in Face-to-face Conversations based on Visual Attention Patterns," in Proc. ACM CHI Extended Abstract, pp. 1175--1180, Apr. 2006.

その他会議予稿

黒住，木村，永野，柏野, ``幾何変換パラメータを特定する縮退生成探索法'', 信学技報 PRMU2006-171 pp. 1--6, Dec. 2006.
A. Kimura, T. Uyematsu and S. Kuzuoka, "Universal source coding for complementary delivery," in Proc. Symposium on Information Theory and its Applications (SITA2006, domestic), Vol.2, pp. 803--806, Hakodate, Hokkaido, Japan, Nov.-Dec. 2006.
A. Kimura and T. Uyematsu, "Information-theoretical analysis of index searching: Revised," in Proc. Symposium on Information Theory and its Applications (SITA2006, domestic), Vol.1, pp. 73--76, Hakodate, Hokkaido, Japan, Nov.-Dec. 2006.
大塚，「非言語行動の観測に基づく複数人物の会話シーン分析」', 人工知能学会研究会資料第48回言語・音声理解と対話処理研究会 (SIG-SLUD), No. SIG-SLUD-A602-01, pp. 1--6, Nov. (2006) 【招待講演】
A. Kimura and T. Uyematsu, "Multiterminal source coding for cascading and feedback refinement systems," in Proc. Shannon Theory Workshop (STW2006, domestic), pp. 25--31, Kinosaki, Hyogo, Japan, Sep. 2006.
大塚，大和，村瀬，「複数人物の対面会話シーンを対象とした画像中の人物頭部追跡に基づく会話構造のモデル化と確率的推論」，画像の認識・理解シンポジウム2006
K. Kashino : "Fast Search Methods for Music and Video Signals", 中日工程技術検討会 (Jun. 2006).
A. Kimura and T. Uyematsu, "Multiterminal source coding with complementary delivering," IEICE Technical Report, IT2006-8, pp. 7--12, Nara, Japan, May. 2006, Presented at 2006 Hawaii, IEICE and SITA Joint Conference on Information Theory.

2005

論文

賀沢, 泉谷, 平, 前田, 磯崎, "最大マージン原理に基づく多重ラベリング学習", 電子情報通信学会論文誌 D-II, J88-D-II, (11), pp. 2246--2259, Nov. 2005.
M. Mori, M. Sawaki, N. Hagita, “Video text recognition using category-dependent feature extraction based on feature compensation,”Systems and Computers in Japan Vol. 36, Issue 10, pp. 1--8, Sep. 2005.
木村，川西、柏野 "SPIRE：スパースなインデキシングを用いた画像中の同一部分領域の検出", 電子情報通信学会論文誌 D-II, Vol.J88-D-II, No.8, pp. 1712--1719, Aug. 2005. Published online in IEICE Transactions Online
川西、久野、木村、黒住、柏野、高木 "サブテンプレート間距離を用いた適応的ウィンドウスキップによる高速テンプレートマッチング法", 電子情報通信学会論文誌 D-II, Vol.J88-D-II, No.8, pp. 1389--1397, Aug. 2005. Published online in IEICE Transactions Online
竹前, 大塚, 武川：「対面の複数人対話を撮影対象とした対話参加者の視線に基づく映像切り替え方法とその効果」，情報処理学会論文誌, Vol.46, No. 7, pp. 1752--1767, 2005.
黒住, 柏野, 村瀬: "携帯電話で受音した音をキーとする楽曲探索法", 電子情報通信学会論文誌, vol.J86-D-II, no.12, pp. 1719--1726 (Dec. 2003). (電気通信普及財団テレコムシステム技術賞奨励賞 (2005年3月22日))

書籍、解説記事

柏野: "ベイジアンネットワークの音響認識への応用", 日本音響学会誌, vol.61, no.12, pp. 714--719 (Dec. 2005).

国際会議予稿

T. Kawanishi, M. Tsuchida, S. Takagi, A. Kimura and J. Yamato "Small cylindrical display using asherical mirror for anthropomorphic agents", in Proc. International Display Workshop / Asia Display (IDW/AD'05), pp. 1755--1758, Takamatsu, Kagawa, Japan, Dec. 2005.
K. Otsuka, Y. Takemae, J. Yamato, and H. Murase, “A Probabilistic Inference of Multiparty-Conversation Structure Based on Markov-Switching Models of Gaze Patterns, Head Directions, and Utterances,” in Proc. ACM Int. Conf Multimodal Interfaces (ICMI)'05, pp. 191--198, Oct. 2005.
Y. Takemae, K. Otsuka, J. Yamato: Effects of Automatic Video Editing System Using Stereo-Based Head Tracking for Archiving Meetings, IEEE International Conference on Multimedia & Expo (IEEE/ICME 2005).
K. Otsuka, Y. Takemae, J. Yamato, and H. Murase, “Probabilistic Inference of Gaze Patterns and Structure of Multiparty Conversations from Head Directions and Utterances,” in Proc. 1st. International Workshop on Conversational Informatics, pp. 7--12, 2005.
Y. Takemae, K. Otsuka, and J. Yamato, “Development of Automatic Video Editing System Based on Stereo-Based Head Tracking for Archiving Meetings,” The Third International Conference on Active Media Technology (AMT2005), p.269, 2005.
Y. Takemae, K. Otsuka, and J. Yamato “ Automatic Video Editing System Using Stereo-Based Head Tracking for Multiparty Conversation,” ACM Conference on Human Factors in Computing Systems (ACM/CHI2005), pp. 1817--1820, 2005.

その他会議予稿

木村，植松 "インデックス検索の情報理論的解析", 情報理論とその応用シンポジウム(SITA2005)予稿集, Vol.II、pp. 721--724、沖縄県国頭郡恩納村、2005年11月
柏野，木村，黒住 "局所的・大域的クラスタリングに基づく音・映像の高速時系列探索法", 電子情報通信学会技術報告、 PRMU2005-25 (DE2005-3)、北海道札幌市、2005年6月
木村、川西、大塚、柏野、 "重み付き特徴点照合に基づく高速画像検索", 電子情報通信学会技術報告、 PRMU2005-24 (DE2005-2)、北海道札幌市、2005年6月
柏野: "長時間メディアの高速時系列探索", 電子情報通信学会総合大会, pp. SS-2--SS-3 (Mar. 2005).

2004

論文

M. Mori, M. Sawaki, N. Hagita, H. Murase, N. Mukawa, “Robust feature extraction method based on run-length compensation for degraded character recognition,”Systems and Computers in Japan, Vol. 35, Issue 9, pp. 1--9, Aug. 2004.
森，澤木，萩田，“特徴補正に基づくカテゴリー依存特徴抽出法による映像中文字認識,” 電子情報通信学会論文誌（D-II）, vol.J87-D-II, no.8, pp. 1632--1640, Aug. 2004.
永野, 柏野, 村瀬: "多数の小領域スペクトログラムの探索に基づく背景音楽の高速探索法", 電子情報通信学会論文誌, vol.J87-D-II, no.5, pp. 1179--1188 (May. 2004). (電気通信普及財団テレコムシステム技術賞奨励賞 (2005年3月22日))

国際会議予稿

Y. Takemae, K. Otsuka, N. Mukawa, “An Analysis of Speakers' Gaze Behavior for Automatic Addressee Identification in Multiparty Conversation and Its Application to Video Editing,” in Proc. IEEE International Workshop on Robot and Human Interactive Communication (IEEE/RO-MAN 2004), pp. 581--586, 2004.
T. Kawanishi, T. Kurozumi , K. Kashino and S. Takagi, ``A Fast Template Matching Algorithm with Adaptive Skipping Using Inner-Subtemplates' Distances'', in Proc. ICPR2004, Aug. 2004.
K. Kashino , A. Kimura, and T. Kurozumi : "A quick video search method based on local and global feature clustering", in Proc. International Conference on Pattern Recognition (ICPR) (Aug. 2004).
K. Otsuka and N. Mukawa, “A Particle Filter for Tracking Densely Populated Objects Based on Explicit Multiview Occlusion Analysis,” in Proc. ICPR2004(International Conference on Pattern Recognition), Volume. 4, pp. 23--26, Aug. 2004.
A. Kimura, T. Kawanishi and K. Kashino , "Acceleration of similarity-based partial image retrieval using multistage vector quantization," in Proc. International Conference on Pattern Recognition (ICPR2004), Vol.2, pp. 993--996, Cambridge, United Kingdom, Aug. 2004.
K. Otsuka and N. Mukawa, “Multiview Occlusion Analysis for Tracking Densely Populated Objects Based on 2-D Visual Angles,” in Proc. CVPR2004(IEEE Conference on Computer Vision and Pattern Recognition), Volume 1, pp. 90--97,Jun. 2004.
A. Kimura, T. Kawanishi and K. Kashino , "Similarity-based partial image retrieval guaranteeing same accuracy as exhaustive matching," in Proc. International Conference on Multimedia and Expo (ICME2004), Vol. 3, pp. 1895--1898, Taipei, Taiwan, Jun. 2004.
K. Kashino and Simon Godsill: "Bayesian estimation of simultaneous musical notes based on frequency domain modelling", in Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP) (May. 2004).
Y. Takemae, K. Otsuka, and N. Mukawa, “Impact of Video Editing Based on Participants’ Gaze in Multiparty Conversation,” CHI2004(ACM Conference on Human Factors in Computing Systems), pp. 1333--1336 , 2004.

その他会議予稿

永野, 柏野, 藤原: "２値多重音響特徴ベクトルを用いた類似音楽探索法の頑健性評価", 情報処理学会研究報告, 2004-MUS-58, pp. 39--44 (Dec. 2004).
黒住，柏野, ``実環境で収録した映像をキーとする一致映像探索'', MIRU2004, Jul. 2004.
川西，黒住，柏野，高木, ``サブテンプレート間距離を用いた適応的スキップによる高速テンプレートマッチング法-スキッピングテンプレートマッチング法-'', MIRU2004, Jul. 2004.
柏野, 木村, 黒住: "高速な一致映像探索", 画像の認識・理解シンポジウム (MIRU), vol.1, pp. 155--156 (Jul. 2004).
木村，川西，柏野， "SPIRE: 総当たり照合と同一の精度を保証する類似部分画像検索", 画像の認識・理解シンポジウム (MIRU2004)予稿集， Vol. 2、pp. 400--404、北海道函館市、2004年7月

2003

論文

黒住，柏野，村瀬, ``実環境で受音した楽音をキーとする楽曲探索法'', 信学論 D-II, Vol.J86-D-II, No.12, pp. 1719--1726, Dec. 2003.
大塚，武川：「多視点観測に基づく複数物体の相互オクルージョン解析と逐次状態推定」，情報処理学会論文誌，Vol.44, No. SIG17(CVIM8),pp. 109--125, Dec. 2003.
木村，柏野，黒住，村瀬， "グローバルな枝刈りを導入した音や映像の高速探索", 電子情報通信学会論文誌 D-II, Vol.J85-D-II, No.10, pp. 1552--1562, Oct. 2002. Translated into English, Systems and Computers in Japan, Vol.34, No.13, pp. 47--58, Nov. 2003. Published online in IEICE Transactions Online
永野, 柏野, 村瀬: "二値多重音響特徴ベクトルを用いた類似音楽探索とその高速化", 電子情報通信学会論文誌, vol.J86-D-II, no.11, pp. 1657--1667 (Nov. 2003).
K. Kashino , T. Kurozumi , and H. Murase: "A Quick Search Method for Audio and Video Signals Based on Histogram Pruning", IEEE Transactions on Multimedia, vol.5, no.3, pp. 348--357 (Sep. 2003). (IEEE Transactions on Multimedia Paper Award)
川西，黒住，柏野，高木, ``参照画像内の部分領域間の残差情報を利用した高速テンプレート照合法'', 情報科学技術フォーラム情報技術レターズ, Vol. 2, pp. 175--176, Sep. 2003.
森，澤木，萩田，村瀬，武川，“ランレングス補正を用いた画質劣化にロバストな特徴抽出法,” 電子情報通信学会論文誌（D-II）, vol.J86-D-II, no.7, pp. 1049--1057, Jul. 2003.
K. Kashino , T. Kurozumi , and H. Murase: "Learning-based Active Search Library Enables Instantaneous Information Retrieval for Broadcast Commercials and Music", NTT REVIEW, vol.15, no.2, pp. 38--41 (Mar. 2003).

書籍、解説記事

木村, 黒住, 柏野, 村瀬: "グローバルな枝刈りを導入した音や映像の高速探索", 画像ラボ, vol.14, no.11, pp. 60--67 (Nov. 2003).
柏野, 黒住, 村瀬: "同じ音や映像を高速に探す技術学習アクティブ探索法", NTT R&D, vol.52, no.2, pp. 115--121 (Feb. 2003).

国際会議予稿

T. Kawanishi, T. Kurozumi , S. Takagi and K. Kashino , ``Skipping Template Matching Guaranteeing Same Accuracy with Exhaustive Search'', in Proc. ICAPR2003, pp. 209--212, Dec. 2003.
M. Mori, “Video text recognition using feature compensation as category-dependent feature extraction,” 7th International Conference on Document Analysis and Recognition, pp. 645--649, Edinburgh, Scotland, Aug. 2003.
A. Kimura, K. Kashino , T. Kurozumi and H. Murase, "Dynamic-segmentation-based feature dimension reduction for quick audio/video searching," in Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP2003), Vol.3, pp. 357--360, Hong Kong, Apr. 2003 (cancelled). in Proc. International Conference on Multimedia and Expo (ICME2003), Vol.2, pp. 389--392, Baltimore, Maryland, USA, Jul. 2003.
H. Nagano, K. Kashino , and H. Murase: "A Fast Search Algorithm for Background Music Signals Based on the Search for Numerous Small Signal Components", in Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP), presented at ICME2003, vol.5, pp. 796--799 (Apr. 2003).
Y. Takemae, K. Otsuka, and N. Mukawa, "Video Cut Editing Rule Based on Participants` Gaze in Multiparty Conversation," ACM Multimedia 2003, pp. 303--306, 2003.

その他会議予稿

森, “特徴補正を用いたカテゴリ依存特徴抽出法による映像中文字認識,”電子情報通信学会パターン認識・メディア理解研究会，PRMU2002-246, Mar. 2003.
木村，柏野，黒住，村瀬， "区分線形写像に基づく音や映像の高速探索 - 特徴系列の分割による次元削減の導入 ", データ工学ワークショップ (DEWS2003)予稿集， 3-A-1、石川県金沢市、2003年3月
大塚，武川，「多視点観測に基づく複数物体の相互オクルージョン解析と逐次状態推定」，情処研報, Vol.2003-CVIM-136,No.17, pp. 123--130, 2003.

2002

論文

木村，柏野，黒住，村瀬, ``グローバルな枝刈りを導入した音や映像の高速探索'', 信学論 D-II, Vol. J85-D-II, No.10, pp. 1552--1562, Oct. 2002.
黒住, 柏野, 村瀬: "携帯電話で受音した音をキーとする音響信号探索", 情報科学技術フォーラム情報技術レターズ, pp. 159--160 (Sep. 2002).

書籍、解説記事

柏野, 黒住, 村瀬: "楽曲やＣＭの高速探索を実現する学習アクティブ探索ライブラリ", NTT 技術ジャーナル, vol.14, no.12, pp. 50--52 (Dec. 2002).
柏野: "音楽を聞き分けるコンピュータ", システム／制御／情報 (システム制御情報学会誌), vol.46, no.11, pp. 659--664 (Nov. 2002).
柏野, 黒住, 村瀬: "音や映像を素早く探すメディア探索技術の未来", NTT 技術ジャーナル, vol.14, no.8, pp. 59--62 (Aug. 2002).
黒住，柏野，村瀬, ``確率ディザボーティング: 低品質な映像も瞬時に探すためのコア技術'', 日本工業出版画像ラボ, Vol.13, No.7, pp. 41--46, Jul. 2002.

国際会議予稿

T. Kurozumi , K. Kashino and H. Murase, ``A Robust Audio Searching Method for Cellular-Phone-Based Music Information Retrieval'', in Proc. ICPR2002, Vol. 3, pp. 991--994, Aug. 2002.
H. Nagano, K. Kashino , and H. Murase: "Fast Music Retrieval Using Polyphonic Binary Feature Vectors", IEEE International Conference on Multimedia and Expo (ICME), vol.1, pp. 101--104 (Aug. 2002).
M. Mori, M. Sawaki, N. Hagita, “Category-dependent Feature Extraction for recognition of degraded handwritten characters,” 16th International Conference on Pattern Recognition, vol.3, pp. 155--159, Quebec, Canada, Aug. 2002.
A. Kimura, K. Kashino , T. Kurozumi and H. Murase, "A quick search method for multimedia signals using feature compression based on piecewise linear maps," in Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP2002), Vol.4, pp. 3656--3659, Orlando, Florida, USA, May. 2002.

その他会議予稿

黒住，柏野，村瀬, ``携帯カメラで収録した映像をキーとする一致映像探索'', 信学技法 PRMU2002-130 pp. 7--11, Dec. 2002.
木村，柏野，黒住，村瀬， "音や映像の高速探索のための動的分割に基づく特徴次元削減法", 電子情報通信学会技術報告， PRMU2002-167、沖縄県那覇市、2002年12月
永野, 柏野, 村瀬: "多数の小区間信号の探索に基づく背景音楽の探索", 電子情報通信学会研究報告, PRMU2002-86, pp. 37--41 (Sep. 2002).
森，澤木，萩田, “画質劣化文字認識のためのカテゴリに依存した特徴抽出法,”電子情報通信学会パターン認識・メディア理解研究会，PRMU2001-277, Mar. 2002.
森，澤木, “低品質文字の認識手法とその応用に関するサーベイ,”電子情報通信学会パターン認識・メディア理解研究会，PRMU2001-275, Mar. 2002.
木村，柏野，黒住，村瀬， "区分線形写像に基づく音響信号の高速探索", 日本音響学会春季研究発表会予稿集， 3-P-28、神奈川県横浜市西区、2002年3月
木村，柏野，黒住，村瀬， "区分線形写像に基づく映像信号の高速探索", 電子情報通信学会技術報告， PRMU2001-243、東京都千代田区、2002年2月

2001

論文

黒住，柏野，村瀬, ``時系列アクティブ探索法のための特徴ひずみに頑健な確率ディザボーティング'', 信学論 D-II, Vol. J84-D-II, No.8, pp. 1817--1825, Aug. 2001.

書籍、解説記事

柏野, 黒住, 村瀬: "時系列アクティブ探索法に基づく音や映像の高速 AND/OR 探索", NTT R&D, vol.50, no.11, pp. 895--901 (Nov. 2001).
K. Kashino , H. Murase: "A Sound Source Identification Method for Music Performances Using Auditory Stream Extraction", NTT REVIEW, vol.13, no.2, pp. 40--47 (Feb. 2001).

国際会議予稿

T. Kurozumi , K. Kashino and H. Murase, ``A Method for Robust and Quick Video Searching Using Probabilistic Dither-voting'', in Proc. ICIP2001, Vol. 2, pp. 653--656, Oct. 2001.
M. Mori, M. Sawaki, N. Hagita, H. Murase, N. Mukawa, “Robust Feature Extraction Based on Run-length Compensation for Degraded Handwritten Character Recognition,” Sixth International Conference on Document Analysis and Recognition, pp. 650--654, Seattle, Washington, Sep. 2001.
A. Kimura, K. Kashino , T. Kurozumi and H. Murase, "Very quick audio searching : Introducing global pruning to the Time-Series Active Search," in Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP2001), Vol.3, pp. 1429--1432, Salt Lake City, Utah, USA, May. 2001.

その他会議予稿

永野, 柏野, 村瀬: "メディア探索のための曖昧文字列照合の高速計算法", 電子情報通信学会情報・システムソサイエティ大会講演論文集, p.197 (Sep. 2001).
森，澤木，萩田，武川,”ランレングス補正に基づく劣化手書き文字認識のための特徴抽出法,” 2001電子情報通信学会ソサイエティ大会, Sep. 2001.
永野, 柏野, 村瀬: "類似度に基づく曖昧文字列照合法と音楽検索への適用", 情報処理学会研究報告, 2001-MUS-41, pp. 67--72 (Aug. 2001).
黒住，柏野，村瀬, ``特徴ひずみに頑健な部分空間を用いた携帯端末による音響信号探索'', 信学技法 IE2001-23 PRMU2001-43 MVE2001-22 pp. 31--38, Jul. 2001.
森，澤木，萩田，武川, “ランレングス補正を用いた画質劣化にロバストな特徴抽出法,”電子情報通信学会パターン認識・メディア理解研究会，PRMU2001-83, Jul. 2001.
黒住，柏野，村瀬, ``携帯電話で受音した音楽をキーとする高速音響信号探索'', 信学会総合大会情報システム2, p.224, Mar. 2001.
木村，柏野，黒住，村瀬， "グローバルな枝刈りを導入した長時間音響信号の高速探索－時系列アクティブ探索の高速化－", 電子情報通信学会技術報告， PRMU2000-200、神奈川県横浜市港北区、2001年2月

2000

論文

柏野, 黒住, 村瀬: "ヒストグラム特徴を用いた音や映像の高速 AND/OR 探索", 電子情報通信学会論文誌, vol.J83-D-II, no.12, pp. 2735--2744 (Dec. 2000).
K. Kashino , G. Smith, and H. Murase: "Quick Audio Retrieval Based on Histogram Feature Sequences", Journal of Acoustical Society of Japan (E), Vol.21, no.4, pp. 217--219 (Jul. 2000).

書籍、解説記事

柏野: "聖徳太子をつくる技術編集にあたって", 情報処理, vol.41, no.10, p.1089 (Oct. 2000).
柏野, 村瀬: "音の流れを認識して楽器を聞き分けるコンピュータ", NTT R&D, vol.49, no.10, pp. 582--589 (Oct. 2000).
柏野, 村瀬: "音や映像を瞬時に探す時系列アクティブ探索法", NTT R&D, vol.49, no.7, pp. 407--413 (Jul. 2000).
柏野: "DPマッチング", 日本ファジィ学会誌, vol.12, no.1, pp. 19--22 (Jan. 2000).

国際会議予稿

K. Kashino , T. Kurozumi , and H. Murase: "Feature Fluctuation Absorption for a Quick Audio Retrieval from Long Recordings", in Proc. International Conference for Pattern Recognition (ICPR), vol.3, pp. 102--105 (Sep. 2000).

その他会議予稿

坂野，有田，大町，岡田，栗田，斎藤，島田，藤木，森, “国際会議報告：ICPRとその周辺,” 電子情報通信学会パターン認識・メディア理解研究会，PRMU2000-146, Dec. 2000.
柏野, 黒住, 村瀬: "多種類の特徴歪みを考慮した音響信号の高速探索法", 電子情報通信学会研究報告, SP2000-64, pp. 63--69 (Oct. 2000).
黒住，柏野，村瀬, ``時系列アクティブ探索法のための特徴変動に頑健な確率ディザボーティング'', MIRU2000, Vol. 1, pp. 313--318, Jul. 2000.
柏野, 黒住, 村瀬: "二つの音響信号に共通に現れる部分信号区間の高速自動抽出", 日本音響学会春季研究発表会講演論文集, vol.1, pp. 133--134 (Mar. 2000).

1999

論文

柏野, スミス, 村瀬: "ヒストグラム特徴を用いた音響信号の高速探索法 - 時系列アクティブ探索法 -", 電子情報通信学会論文誌, vol.J82-D-II, no.9, pp. 1365--1373 (Sep. 1999). (電子情報通信学会情報通信ソサイエティ論文賞 (2001年9月20日))
K. Kashino and H. Murase: "A Sound Source Identification System for Ensemble Music Based on Template Adaptation and Music Stream Extraction", Speech Communication, Vol.27, pp. 337--349 (Mar. 1999).

招待講演

K. Kashino and H. Murase: "Quick Audio-Visual Search Using Time-Series Active Search", in Proc. IWHIT/SM99, pp. 9--14 (Oct. 1999).

国際会議予稿

K. Kashino , G. Smith, and H. Murase: "Time-Series Active Search for Quick Retrieval of Audio and Video", in Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP), Vol.6, pp. 2993--2996 (Mar. 1999).

その他会議予稿

柏野, 村瀬: "オーバースキッピングによる時系列アクティブ探索法の高速化", 日本音響学会秋季研究発表会講演論文集, pp. 445--446 (Sep. 1999).
柏野, 村瀬: "時系列アクティブ探索法における音響信号の高速 AND/OR 探索", 電子情報通信学会研究報告, SP99-23, pp. 41--48 (Jun. 1999).
柏野, 村瀬: "複数の音響信号の高速探索", 日本音響学会春季研究発表会講演論文集, pp. 447--448 (Mar. 1999).

1998

論文

柏野, 村瀬: "単音連繋確率ネットワークに基づく音楽演奏の音源同定", 人工知能学会誌, vol.13, no.6, pp. 962--970 (Nov. 1998).
柏野, 村瀬: "適応型混合テンプレートを用いた音源同定 - 音楽演奏への適用 -", 電子情報通信学会論文誌, vol.J-81-D-II, no.7, pp. 1510--1517 (Jul. 1998).

書籍、解説記事

柏野: "重なり合った音を聞き分ける - 音源分離", コンピュータと音楽の世界 II　(bit 別冊) (Jul. 1998).
K. Kashino , K. Nakadai, T. Kinoshita, and H. Tanaka: "Application of Bayesian Probability Network to Music Scene Analysis", In "Computational Auditory Scene Analysis", Lawrence Erlbaum Associates, pp. 21--26 (May. 1998).
柏野訳 (監訳: 大串健吾): "音楽の知覚心理学 (第9章)", 誠信書房 (Mar. 1998).

招待講演

柏野, 村瀬: "音の流れを考慮した音源同定", 人工知能学会並列AI研究会, SIG-Ch-9801, pp. 15--18 (Nov. 1998).
柏野, 村瀬: "音の流れを考慮した音源同定", 電気関連学会関西支部連合大会, p. S16 (Nov. 1998).

国際会議予稿

K. Kashino and H. Murase: "Music Recognition Using Note Transition Context", in Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP), Vol.6, pp. 3593--3596 (May. 1998).
G. Smith, H. Murase, and K. Kashino : "Quick Audio Retrieval Using Active Search", in Proc. International Conference on Acoustics, Speech and Signal Processing (ICASSP), Vol.6, pp. 3777--3780 (May. 1998).

その他会議予稿

柏野, スミス, 村瀬: "マルチモーダルアクティブ探索を用いた画像・音響時系列の高速探索", 電子情報通信学会研究報告, PRMU98-80, pp. 51--58 (Sep. 1998).
柏野, スミス, 村瀬: "ヒストグラム特徴系列に基づく長時間音響信号の高速探索", 日本音響学会秋季研究発表会講演論文集, pp. 561--562 (Sep. 1998). (日本音響学会第16回粟屋潔学術奨励賞 (1999年3月9日))
柏野, 村瀬: "パート譜を用いたボーカル音分離システム", 日本音響学会春季研究発表会講演論文集 (Mar. 1998).
柏野, 村瀬: "アンサンブル演奏の自動アンミキサ", 電子情報通信学会研究報告, SP97-104, pp. 33--40 (Feb. 1998).

1997

国際会議予稿

K. Kashino and H. Murase: "A Music Stream Segregation System Based on Adaptive Multi-Agents", in Proc. International Joint Conference on Artificial Intelligence (IJCAI), vol.2, pp. 1126--1131 (Aug. 1997).
K. Kashino and H. Murase: "Sound Source Identification for Ensemble Music Based on the Music Stream Extraction", Working Notes of IJCAI Workshop of Computational Auditory Scene Analysis (IJCAI-CASA), pp. 127--134 (Aug. 1997).
T. Nakatani, K. Kashino , and H. G. Okuno: "Integration of Speech Stream and Music Stream Segregations Based on a Sound Ontology", Working Notes of IJCAI Workshop of Computational Auditory Scene Analysis (IJCAI-CASA), pp. 25--32 (Aug. 1997).

その他会議予稿

柏野, 村瀬: "確率ネットワークに基づく音響認識 - 音楽認識から一般音認識への展開 -", 日本ソフトウェア科学会ワークショップ (MACC) (Dec. 1997).
中谷, 柏野, 奥乃: "音声分離と楽音分離の統合のための音オントロジーの提案", 人工知能学会全国大会講演論文集 (Jun. 1997). (人工知能学会全国大会優秀論文賞　(1997年6月26日))
柏野, 村瀬: "動的メロディー抽出を用いたアンサンブル演奏の音源同定", 日本音響学会音楽音響研究会資料, MA97-4, pp. 23--38 (May. 1997).
柏野, 村瀬: "適応型混合テンプレートを用いた音源同定 - 複数楽器演奏への適用 -", 電子情報通信学会研究報告, SP96-117, pp. 21--26 (Feb. 1997).