更新日:2020/9/14

    秘匿スパース演算を用いた分散メディア処理技術NTT未来ねっと研究所

    概要

    スパースモデリングは大量のデータの中に隠れている有為な情報を抽出する情報処理モデルとして注目されています。深層学習に対して、1)少量データでの学習が可能、2)少ない演算量、3)説明可能なAIといった側面も持ち、注目されています。考案した秘匿スパース演算は、暗号化データに対してスパースモデリングの学習と実行が可能なAI技術です。エッジ/クラウドで処理を行い、事故などでデータが流出してもコンテンツの中身を保護できます。

    背景・従来課題

    ビッグデータ、IoT、AI時代の到来とともに、あらゆるデジタルコンテンツが質量ともに増え続けています。しかしながら不必要なデータも多く、活用するためにはデータを解析する必要があります。一方、エッジ/クラウドの利用が急速に普及しています。ところがその利用は、サービス提供者の信頼性を前提にしており、信頼性の欠如や事故によるデータの不正利用や流失によって、プライバシーを侵害する問題の発生が危惧されています。

    本技術のアドバンテージ

    • 画像メディアなどのデータを暗号化したまま、データサイズを小さくする圧縮やパターン認識が可能です。
    • スパースモデリングの数理モデルに基づいた方法で、結果の説明が可能なAI技術です。
    • 膨大な演算や大量データを必要とする深層学習と比較して、低演算、少ないデータ量で動作します。

    利用シーン

    • プライバシー保護を考慮したSNSなどのクラウドサービスを提供でき、ユーザに安心してお使いいただけます。また、データが少ない場合でも学習が可能で、個別に最適化したサービスが実現できます。
    • 監視カメラなど公共サービスで利用ができます。公共の場所での撮影はプライバシー侵害が危惧されますが、暗号化して顔画像の認識などを行うことで、プライバシーを保護しつつ公共の安全に寄与できます。

    解説図表

    技術解説

    スパースモデリングは膨大なデータのほとんどの要素をスパース(疎、すかすか)と考え、非ゼロ要素に着目することでデータの本質の抽出します。元々は生物の一次視覚野の情報処理を数学的にモデル化したものですが、現在は多数の分野に応用されています。例えば、画像・音響などのメディア処理、脳波など生体信号の解析、パターン認識などで、その有効性が認められています。スパースモデリングの学習アルゴリズムとしてK-SVD、実行アルゴリズムとしてOMPやLASSOがあります。考案した秘匿スパース演算では、ランダムユニタリ変換と呼ばれる方法で学習データならびに実行データを暗号化します。暗号化前と暗号化後で、K-SVD、OMPならびにLASSOの演算結果が変わらないことを証明しました。秘匿スパース演算を利用した具体的な応用例として、暗号化画像の圧縮やパターン認識があります。少ない学習データならびに低演算量で、深層学習に匹敵する性能を達成しています。また、エッジ/クラウドネットワークでの利用を前提とした秘匿スパース演算の分散アルゴリズムを考案しました。複数の各拠点で暗号化した画像を分散配置されたエッジサーバへアップロードして個別に学習を行います。その結果をクラウドで統合して実行することで、圧縮性能や認識精度を向上させることに成功しました。

    用語解説

    ランダムユニタリ変換
    行列の各要素がランダムな値を持つユニタリ変換です。ユニタリ変換は、変換の前後でユークリッド距離や内積が変わらない性質を持ちます。

    K-SVD (K-Sigular Value Decomposition)
    スパースモデリングの代表的な学習アルゴリズムです。大量のデータの中から特徴量を抽出して、基底の集合である辞書を生成します。基底は、データを分解する際の基本要素です。

    OMP (Orthogonarl Matching Pursuit)
    スパースモデリングの代表的な実行アルゴリズムです。L0ノルム正則化と呼ばれる非ゼロ要素の数に基づく条件を課すことで、最適化問題を解きます。

    LASSO (Least Absolute Shrinkage and Selection Operator)
    スパースモデリングの代表的な実行アルゴリズムです。L1ノルムと呼ばれる絶対値に基づく条件を課すことで、最適化問題を解きます。

    担当部署

    NTT未来ねっと研究所 フロンティアコミュニケーション研究部

    関連するコンテンツ