更新日:2020/10/23

    究極のプライベート音空間を実現するメディア処理技術NTTメディアインテリジェンス研究所

    ※記事本文中の研究所名が、執筆・取材時の旧研究所名の場合がございます。

    NTT技術ジャーナル2020年10月号:特集「メディア研究から人の活動を支援・代替するAI技術の研究開発へ」より

    福井 勝宏(ふくい まさひろ)/ 齊藤 翔一郎(さいとう しょういちろう)/小林 和則(こばやし かずのり)

    はじめに

    政府が推進する働き方改革および新型コロナウイルスの影響により、従来のようにオフィスに出社する働き方が見直され、場所や時間にとらわれない柔軟なワークスタイルが注目を浴びています。こうした新しいワークスタイルで重要となるのが、どんな場所でも快適に仕事をするための音環境が整えられることです。ここで、在宅勤務について考えてみましょう。家の中には、エアコンが発するノイズや屋外の自動車走行音、時には宅配便を知らせるチャイムなど、いろいろな音が存在します。家族がいる場合は、その人たちの声やテレビからの音もあるかもしれません。エアコンなどのノイズや家族・テレビが発する音は在宅勤務者にとって「聞きたくない音」です。しかし、状況によっては、チャイムや赤ちゃんの泣き声は「聞きたい音」になる場合があります。在宅で電話会議などを行う場合、こちら側で発生するノイズは通信相手に届けたくありません。反対に、通信相手からの音声は、他の人に聞かせたくありません。このように、在宅勤務者が、聞きたい音だけ聞ける、また通信相手からの音声は在宅勤務者だけに聞こえる、といった究極のプライベート音空間をつくり出すことができれば、快適な在宅勤務ができるようになります。
    現在、NTTメディアインテリジェンス研究所では、「パーソナライズドサウンドゾーン(PSZ: Personalized Sound Zone)」と名付けたこの究極のプライベート音空間の実現をめざしています(図1)。PSZでは、周囲の音情報を正確に集音し、周囲の状況を理解したうえで、適切に音を制御する、など複数の技術を組み合わせて実現します。NTTメディアインテリジェンス研究所ではこれまで集音技術について多くの知見を蓄積しており、それをさらに発展させた音の「状況理解」や「制御」の技術に現在取り組んでいます。以下に、大きく3つの取り組みについて紹介します。

    図1 パーソナライズドサウンドゾーンコンセプト
    図1 パーソナライズドサウンドゾーンコンセプト

    周囲の状況を理解する技術(イベント検知・シーン識別技術)

    人は状況によって聞きたい音が異なります。例えば自宅内だと愛犬が鳴く声は聞きたいかもしれませんが、外出先での他の犬の鳴き声は聞きたくないかもしれません。このような場合に、「外出先」において「犬が鳴いている」ということを検知できれば、その音は聞きたくない音である、ということを判断することができます。
    このように、PSZを実現するためには、単純にすべての周囲音を抑制するのではなく、状況に応じてユーザに選択的に音や状況を伝えることが重要です。そのためには、ユーザを取り巻く「環境」を認識する必要があります。そのために、「いつ」「何が」「どこで」といった情報を同時推定する「イベント検知技術」や、「どのような」「なぜ」といった情報の意味を推定する「シーン識別技術」に取り組んでいます。…

    関連するコンテンツ