メディアの科学

研究展示 18

音だけから情景を推定

~音から画像認識結果を予測するクロスメディア情景分析~

どんな研究

部屋などの屋内空間に配置したマイクロホンアレイにより収音した音だけを分析することによって、まるで画像認識したかのように「どこにどんな物体があるのか」を推定する研究です。生活や公共空間での見守りや防犯等への応用に向けての研究開発を進めています。

どこが凄い

『音から画像認識結果を予測する』という試み自体、これまで取り組み例のない新しい技術課題です。本研究では、入力が音響特徴、出力が画像認識結果となるような、クロスメディアな深層学習モデルを設計し、技術的な実現可能性を初めて示しました。

めざす未来

現在の見守り・防犯技術はカメラの利用を前提としており、プライバシー性の高い家庭や公共空間には適用しにくい場合がありました。本技術により、カメラの設置が好ましくない空間の様子もわかりやすく確認できるようになるため、適用領域の拡大が期待できます。

関連文献

  • [1] オストレク ミレラ, 入江豪, 亀岡弘和, 木村昭悟, 平松薫, 柏野邦夫, “Seeing through Sounds: 音響情報からの視覚的情景理解に向けて,” 画像の認識・理解シンポジウム, 2017.

ポスター

アイコンをクリックすると、展示ポスターのPDFが開きます。
PDFの表示にはAdobe Acrobat Reader等のPDF閲覧表示が必要です。

当日の様子

展示代表者

入江 豪
入江 豪
メディア情報研究部