概要
秘密計算AIは、データの登録から前処理、予測モデルの構築、新たなデータに対する予測といった一連のAI処理を、一度もデータを復号することなく実行できる環境を提供します。
これにより、これまでノウハウの流出やデータ漏洩の懸念があって利活用が難しかった、複数企業間のデータを持ち寄ったAI分析や、個人のプライバシー情報を用いた様々なAI分析などが可能になると考えられます。
背景・従来課題
近年、様々な分野でデジタルトランスフォーメーションが活発に進んでいます。特に企業が保有する顧客情報やネットショッピングでの購買履歴、IoTにより収集されるセンサーデータなど、多種多様なビッグデータのAI分析により、様々な産業・サービスが発展すると期待されています。その一方で、企業秘密や個人のプライバシーにかかわるデータは、情報漏洩や不正利用の懸念が大きく、データの収集や利活用を阻害する要因となっていました。
本技術のアドバンテージ
- 機械学習の4大カテゴリのうち、3つのカテゴリ(回帰・分類・クラスタリング)ができる秘密計算技術を世界で初めて高速・高精度に実現 ※4大カテゴリ:回帰・分類・クラスタリング・次元圧縮
- 学習データの通信・保管時だけでなく学習処理する時の演算時、予測データを用いた判定時においてもデータを一切復号すること無く処理が可能
- AIの演算に必須の逆数や平方根などの演算関数の高速化と計算精度維持を実現する関数近似アルゴリズムを実装したことで、秘密計算ではない通常の処理と同程度の速度と精度で学習・予測が可能
- FFNN(Feedforward Neural Network)、CNN(Convolutional Neural Network)、RNN(Recurrent Neural Network)、決定木基本、勾配ブースティング木、階層型クラスタリング、k-means、ロジスティック回帰などの複数アルゴリズムやデータ前処理等の様々な機能を実装
- データ分析の現場で一般的に利用されているプログラミング言語のPythonインターフェースを用いてAIモデルの作成や予測データを用いた判定を実行可能
利用シーン
- 暗号化したままデータを処理できるので、複数者のデータを利⽤したより⾼度なAIを、お互いのデータを⾒ずに構成でき、今までにないサービスを実現することが可能になると考えます。
- 例えば医療分野においては、複数の病院や機関が保有する希少疾患の診療情報や、治療・投薬後の患者データを学習することで、疾患リスクの予測などへの利用が考えられます。
- スマートシティ分野では、個⼈のバイタルデータ、ジムでの運動データ、飲⾷店での⾷事データを学習することで、個⼈に最適化された⾷事や運動メニューの予測などへの利用が考えられます。
解説図表
技術解説
秘密計算AIは、NTTが長年研究している秘密分散ベースの秘密計算をAIの機械学習と予測のアルゴリズムに適用した技術です。学習データだけでなく、予測モデルも暗号化できるため、データ分析者やシステムの運用者を含む第三者に対して、データの中身を開示することなく様々なAI処理を実行することが可能です。
担当部署
NTT社会情報研究所 社会情報流通研究プロジェクト