NECは11月12日、個人情報のプライバシー保護に関する新技術を開発したと発表した。従来より40~100倍高速に、ほかの情報と照合しても個人を特定できないように匿名化できるという。
個人情報は、性別や生年月日のように一個人に1つの値となる属性(単一値属性)と、病名や投薬名のように一個人に複数の値が含まれる属性(集合値属性)の組み合わせからなる構造を持つ。
従来は、単一値属性と集合値属性をそれぞれ分けて匿名化していたため、精度や安全性に課題があったという。NECは、データの精度を保ちながら単一値属性と集合値属性をまとめて高速化、「ほかの情報と照合しても個人を特定できないよう匿名化」(k-匿名化)させ、特定されるリスクを大きく低減するアルゴリズムを開発したという。
医療情報や健康情報、生活情報や位置情報などさまざまな個人情報をより高度に匿名化でき、データの安全な活用が可能になるとアピールする。
NECは、同技術を活用してExpressサーバで個人情報の1つである医療情報を50万人分をk-匿名化する実験をしたところ、処理時間は通常の40分の1程度程度、約5分だったとした。さらに、NECのデータウェアハウスアプライアンス「InfoFrame DWH Appliance」を使って、1億人規模のデータで試行したケースでは、通常の100分の1となる、約10時間でk-匿名化できたとした。
現在、機密性の高い個人情報を企業内で共有したり、第三者へ提供する際は、個人を特定する情報を削除し、匿名化されるケースが多い。個人情報はほかの情報と照合することで個人が特定される可能性があるため、安全管理の徹底が求められている。
NECは「ビッグデータのより安全な利用に貢献する」とコメントしている。