秘密守ってデータ解析 日本企業に強み、実用化へ動く
個人情報や企業秘密にかかわるデータの秘密を守りながら、データ解析などの計算を行う技術への関心が高まっています。個人の病歴や遺伝情報、購買行動といったデータを「秘密計算」という手法で解析したり、米グーグルが個人追跡型広告に代わる仕組みを計画したりするなど、応用先が急速に広がりつつあります。
2021年2月、NECとIT(情報技術)企業のデジタルガレージ、セキュリティー関連のレピダム(現インフォーズ、東京・渋谷)の3社は秘密計算の普及を目指した「秘密計算研究会」を組織しました。クラウドサービスなどでの同技術利用を想定し、安全性評価の基準作りなどに取り組む計画です。秘密計算の実用化に向けた企業の動きが活発になっています。
プライバシーに配慮した計算は、グーグルが広告配信の技術に使おうとしていることでも注目を集めています。ウェブサイトの閲覧者の行動を追跡できる「サードパーティークッキー」という技術が使われていますが、これに代えて人工知能(AI)を使って利用者をグループ分けする「連合学習」という技術の採用を目指します。批判が多かった、プライバシー情報を使ったターゲティング広告を見直すのが狙いです。
日本の企業や研究機関は、秘密計算で高い技術力を持っています。NECやNTTは、データを複数のサーバーに分散して計算する「秘密分散」という技術で世界トップクラスの演算性能を実現しています。
NECは大阪大学と協力して、複数の医療・研究機関が保有するゲノム(全遺伝情報)や病気の情報を秘匿したまま収集し、ゲノム変異の頻度を解析する技術にメドをつけました。NTTは農業・食品産業技術総合研究機構と共同で、秘密計算を用いた「作物ビッグデータ」の研究を始めています。
情報通信研究機構(NICT)は、グーグルの連合学習と似た仕組みに暗号技術を組み合わせた独自技術を開発しました。神戸大学や金融機関と協力して、振り込め詐欺などの不正送金を検知できるシステムを作ることを目指しています。各金融機関が持つ顧客の送金などの行動パターンの情報を集めて学習し、不正な送金の兆候を捉えて警告が出せるようにします。
秘密計算などの技術が普及すれば、データを保有する企業などはデータ提供への不安が軽減され、企業や業界をまたいでデータを集めやすくなります。NICTの盛合志帆・サイバーセキュリティ研究所長は「秘密計算でデータ提供への不安を解消し、ビッグデータ解析の条件が整えられる」と話しています。
盛合志帆・NICTサイバーセキュリティ研究所長「秘密計算、社会実装に近付く」
プライバシーや企業秘密を守りながらデータ解析を行う「秘密計算」の仕組みや、普及の見通しについて、情報通信研究機構(NICT)の盛合志帆・サイバーセキュリティ研究所長に聞きました。盛合さんは秘密計算の社会実装を目指した国の研究プロジェクトにも参加しています。
――秘密計算はどのようなもので、なぜ注目されているのですか。
「秘密計算とは、データの中身を秘匿したまま計算ができる技術のことです。個人の健診結果や遺伝情報、購買履歴といった様々なデータを集めて解析を行ったり、人工知能(AI)の学習モデルをつくったりする場合、プライバシーや企業秘密にかかわる情報を安全に取り扱う必要があります」
「データを暗号化したままの状態でこうした計算ができれば、サイバー攻撃などで情報が漏洩した場合でもプライバシー情報などを守ることができます。また、こうした計算はデータを別の場所に移動・集約して行うことが多いわけですが、データ秘匿の技術を用意することで、データ提供者の不安に応えることができるでしょう」
「また、AIのディープラーニング(深層学習)によって、実社会で役立つモデルを作るためには、企業や業界をまたがって大量のデータを集めることが有効です。IT大手のGAFAなどに負けないよう大量のデータを集めやすくするためにも、秘密計算技術は有効な手段の一つでしょう」
――秘密計算にはどのような方法がありますか。
「主に2つの技術があります。一つが『準同型暗号』と呼ばれるデータを暗号化したまま足し算や掛け算が行える暗号化方式を使う方法です。出所の異なるデータそれぞれを暗号化した状態で計算を行い、暗号化された状態で得られた計算結果を暗号鍵で解いて、結果を得ます。コンピューターでは足し算と掛け算によってすべての計算ができるので、様々な計算をデータの秘密を守りながら進めることができます」
「もう一つが『秘密分散』と呼ばれる方法です。データを1つのコンピューター(サーバー)ではなく、複数のサーバーに分けて計算を行います。複数のサーバーが協調して計算を行い、最後にそれぞれの計算結果を集約します。個別のサーバーがサイバー攻撃を受けたりしてデータが漏洩しても、元のデータを復元することができない仕組みをつくることができます」
――AIの機械学習と組み合わせる方法もあるそうですね。
「米グーグルが2017年に提案したフェデレーテッドラーニング(連合学習)では、データを集約せず分散した状態で機械学習を行います。例えばスマートフォンやパソコンのような端末には購買履歴のような個人の情報が集まりますが、これを外部に持ち出すことなしに、端末ごとに機械学習を行います。学習によって得られた学習モデルの改善につながる要素だけを集約して全体として大規模な学習を行うというやり方です」
――通常の秘密計算との違いはどこにあるのでしょうか。
「扱える計算の範囲が違います。秘密計算は、準同型暗号を使ったものでも、秘密分散によるものであっても、理論的にはあらゆる種類の計算を扱うことができます。これに対して、フェデレーテッドラーニングの用途は、ディープラーニングをはじめとする機械学習を分散して行うことに限定されます」
「ただ、こうしたビッグデータとして収集される個人データの秘密を守りながら、機械学習によってAIモデルを作ったり、データ解析をしたりする用途は非常に大きいです。NICTや神戸大学などが参加して『プライバシー保護データ解析技術の社会実装』をテーマに科学技術振興機構(JST)で国の研究プロジェクトを進めていますが、ここではフェデレーテッドラーニングのような協調学習に準同型暗号技術を適用した『DeepProtect』というNICTで開発した技術を使っています」
――どのような成果が上がっていますか。
「DeepProtectを使った実証実験では千葉銀行や三菱UFJ銀行など、5つの金融機関と協力して、振り込め詐欺などの不正送金を自動検知するシステムを作ろうとしています。個々の金融機関が持つ送金記録のデータの秘密を守りながら、データ全体で深層学習を行い、検知システムのアルゴリズムを開発しています。近く具体的な成果が発表できる見通しです」
――秘密計算技術の実用化に向け、どのような課題がありますか。
「秘密計算の理論研究は古くからありましたが、近年の研究で計算時間が短くなるなど社会実装が可能なレベルになってきました。金融や医療といった具体的な分野で実際に活用できることを実証してみせることが重要です。秘密計算の社会実装を目指すスタートアップ企業の活動も活発になっており、技術の普及に向け、いよいよ動き出しているという印象です」
(編集委員 吉川和輝)
ワークスタイルや暮らし・家計管理に役立つノウハウなどをまとめています。
※ NIKKEI STYLE は2023年にリニューアルしました。これまでに公開したコンテンツのほとんどは日経電子版などで引き続きご覧いただけます。