English
日本語
ホーム
ごあいさつ
講演動画
研究展示
ダウンロード
お問い合わせ
ホーム
/
講演動画
研究講演
ご所望の声でコミュニケーション
~深層生成モデルが切り拓く音声変換の可能性~
メディア情報研究部
田中 宏
概要
人と人とのコミュニケーションには、物理的・能力的・心理的な状態に起因する様々な形の制約が存在します。私たちは、ある音声を異なる音声や望みの音声へと変換する技術の研究を通じてこのような制約を取り除き、あらゆる人が不自由なく快適にコミュニケーションを行える環境を実現することをめざしています。本講演では、「“音声”が、近年著しく発展を続けている深層学習と組み合わせると、どんなことができるのか?」を題材に、従来技術の課題と私たちの取組みを紹介します。
講演動画
動画の公開は終了いたしました。ご了承くださいますようお願いいたします。
関連コンテンツ
» 【オープンハウス2020 研究展示】顔で声の表情を制御する クロスモーダル音声表情変換
講演資料
講演者紹介
メディア情報研究部
田中 宏
NTT コミュニケーション科学基礎研究所 メディア情報研究部 研究員。2017年奈良先端科学技術大学院大学 情報科学研究科 博士課程修了。博士(工学)。同年NTTに入社以来、音声合成・音声変換の研究に従事。深層生成モデルを用いた音声信号処理に特に興味を持つ。奈良先端科学技術大学院大学優秀学生賞や日本音響学会第47回粟屋潔学術奨励賞を受賞。日本音響学会の会員。
講演動画:
山田 武士
(所長講演)|
大隅 典子
(招待講演) |
田中 宏
|
黒木 忍
|
藤田 早苗
研究展示:
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
11
|
12
|
13
|
14
|
15
|
16
|
17
|
18
|
19
|
20
|
21
|
22
|
23
|
24
|
25
|
26
|
27
|
28
|
29
|
30
|
31
|
前へ
|
次へ
CS研オープンハウスの歴史
|
個人情報の取り扱いについて
|
著作権について
|
サイトマップ
E-mail:
Copyright © 2020 NTT Communication Science Laboratories