富士通研究所とFujitsu Laboratories of America(FLA)は2月15日、複数組織の機密情報やプライバシー情報などを異なる暗号鍵で暗号化したまま、復号することなく、IDや属性値などの一致、不一致の照合が可能な暗号技術を開発したと発表した。富士通研究所は今後、さらなる高速化やデータサイズの圧縮などを進め、年度内の実用化を目指す。
近年、クラウドやビッグデータ分析などの進展に伴い、複数の組織でパーソナルデータや機微情報を相互に活用することが求められるシーンが増えている。例えば、ヘルスケア分野においては、臨床、健康、ゲノムなどを活用し、複数の研究機関による臨床研究や新たな創薬ビジネスにつなげる動きが本格化してきている。しかし、こうした場面では機微データの活用にあたって、プライバシー保護などの点からクラウド上のデータの共有範囲を制限したい、検索内容を秘匿したいといったことが求められている。
医療・創薬分野における情報連携
暗号化したまま計算や検索が可能な暗号化技術として準同型暗号などが存在するが、準同型暗号では全ての組織で同じ暗号鍵を用いるため鍵の厳密な管理が不可欠で、複数の組織が連携したデータの照合には適用することが困難だった。
また、パスワードの一致照合などに広く用いられるデータ変換手法のハッシュ関数も、IDや属性を秘匿したまま照合できる。元データの復元は困難だが、同じデータが必ず同じ値に変換されるため、データの種類が少ない場合に元データが類推されてしまう危険性があるという。
これに対し、発表した技術では、異なる鍵を使用して暗号化した組織ごとのデータを照合し、指定した組織の組み合わせで照合結果を判定できるようにした。同技術における照合用の鍵ではデータを復号することができず、例えば複数の病院間での検査情報や診療記録の連携などにおいて、クラウド環境上で秘匿性を保ったまま複数組織の機微情報を安全に照合できる。
開発した技術は以下の通り。
クラウドを介して異なる暗号鍵で暗号化した文字列を照合する技術
FLAがこれまでに考案した、暗号化された情報同士の一致の程度を計算する関係暗号理論に基づき、異なる暗号鍵で暗号化された文字列同士の照合判定を実現した。この技術では、登録文字列および検索文字列を組織ごとに異なる暗号鍵で暗号化し、照合用のクラウドサーバ上で、暗号化したままそれぞれの組織の登録文字列ごとに検索文字列と一致・不一致の照合をすることができる。
これらの文字列は、ハッシュ関数と同様の効果のある一方向性関数で暗号化しており、暗号化に用いた鍵を利用しても復号できない。照合結果も暗号化され、専用の照合鍵を持っている人だけが見ることができる。
異なる暗号鍵を用いたクラウドを利用した秘匿検索
照合を許可する相手を選択するアクセス制御技術
照合結果を確認するための照合鍵を、情報の提供者、検索者ごとにクラウドに送信する固有の鍵(プレ照合鍵)から生成することで、クラウド上での照会可否を柔軟に制御できる技術を開発した。情報提供者は、どの相手に照合を許可するかというルールを作成し、クラウド側ではルールに基づく提供者と検索者の組合せの照合鍵のみを生成して管理できる。
照合鍵の仕組み
この技術により、富士通研究所では、一般的なPCを用いて0.02秒の速度で1件の文字列同士の一致照合できることを確認した。
開発した技術を、例えば遺伝子情報や医療情報に適用することで、医療研究機関や製薬会社が、患者の情報を秘匿したまま必要な情報について登録されたデータベースに含まれているかを調べることが可能となり、症例の少ない病気の診断支援や新薬開発の効率向上が期待できる。
また本技術は、文字列同士で数ビットの違いを許容した近似照合も可能であり、医療以外にも、金融、教育、行政、マーケティング、特許調査など、これまでにプライバシ情報、企業秘密など情報漏えいに不安があったさまざまな検索シーンに適用でき、特に組織を超えて安全なデータ連携が実現できるとしている。