匿名加工情報作成ソフトウェアの新バージョンを販売開始

NTT研究所の新たな匿名化技術を活用 データとしての有用性を維持した架空のパーソナルデータを合成

NTTテクノクロス株式会社

2021-10-26 11:00

NTTテクノクロス株式会社(本社:東京都港区、代表取締役社長:桑名栄二 以下、NTTテクノクロス)は、NTT研究所の新たな匿名化技術を活用し、合成データ生成機能を搭載した匿名加工情報作成ソフトウェア「tasokarena(タソカレナ)」の新バージョンを2021年11月17日から販売します。
■背景
 昨今、国内DX(デジタルトランスフォーメーション)が加速し、データ利活用が注目されています。その中で、パーソナルデータ*1から特定の個人を識別できないように加工した匿名加工情報*2は、個人情報保護法や次世代医療基盤法*3などの関連する法整備と共に利活用が拡大しています。政府機関の個人情報保護委員会は、匿名加工情報の作成・提供に関する公表を行っている事業者が現在500社に上るとしています*4。
 しかし、匿名加工情報の作成では、元のパーソナルデータの数が少ない場合にはデータの匿名性か有用性のどちらかが低下するという課題があったり、緻密な分析を行う際にはデータの有用性の観点から匿名加工情報よりも実際のパーソナルデータが活用されたりするのが現状です。NTTテクノクロスは、より高度なデータ利活用を実現するため、パーソナルデータの匿名性を維持したまま分析の精度や範囲を高めることを可能にしました。

■特長
(1)データとしての有用性を維持した架空のパーソナルデータを合成
 「tasokarena」新バージョンでは、元のパーソナルデータから特徴量や統計量・分布などが類似するデータを生成し、「実在しないが具体的なパーソナルデータ(合成データ)」を作り上げます。この合成データ生成機能は、匿名性やプライバシーを守りつつ、分析に必要な元のデータの性質を保持したデータを生成するため、従来の匿名加工情報作成ソフトウェアによるパーソナルデータの一般化*5や削除、ランダム化されたデータと比べて、より緻密なデータ分析が可能です。また、少ないデータから匿名化された大量の合成データを生成できるため、膨大なデータを必要とするAIの学習や訓練などに活用できます。

(2)NTT研究所の合成データ生成技術(特許技術)を活用
  NTT社会情報研究所の特許技術である合成データ生成技術を活用しています。各属性の平均など統計値が元データとほぼ等しい合成データを生成する技術等を独自に開発し、これまでプライバシー保護技術では実現できなかった、分析に必要な複数の統計値を保持する多属性の合成データを生成することが可能になりました。NTT社会情報研究所は本技術の開発で培った知見を活用し、AI・機械学習分野における難関国際会議の匿名化技術を競うコンペティションで優勝*6しました。

■価格(税別)
・スタンダード版(GUI版) 60万円~/年
・エンタープライズ版(スタンダード版+自動実行/データ連携機能) 180万円~/年
※年間サブスクリプションライセンス

■匿名加工情報作成ソフトウェア「tasokarena」
 パーソナルデータの特性や利用目的に応じた匿名加工情報の作成を支援するソフトウェアで、2018年7月から販売しています。NTT社会情報研究所が開発したPk-匿名化技術*7を活用しています。 (リンク »)

用語解説

*1:パーソナルデータ
特定の個人を識別することができるかを問わず、個人に関する情報全体を指します。

*2:匿名加工情報
2017年5月施行の改正個人情報保護法により、個人情報を「匿名加工情報」に加工し一定の条件を満たすことで、本人の同意なく柔軟な利活用が可能になりました。「匿名加工情報」とは、特定の個人を識別することができないように加工して得られる個人に関する情報であり、当該個人情報を復元して特定の個人を再識別することができないようにしたものです。

*3:次世代医療基盤法
2018年5月に施行され、認定事業者が複数の医療機関から患者情報の提供を受け、データを匿名加工した上で研究機関や企業に提供することが可能になりました。

*4:出典 パーソナルデータの適正な利活用の在り方に関する実態調査(令和元年度)報告書(個人情報保護委員会)( (リンク ») )

*5:パーソナルデータの一般化
 パーソナルデータの個人情報が含まれる記述などについて、上位カテゴリーもしくは数値に置き換えること、または数値を四捨五入などして丸めることを指します。
 例)「神奈川県」を「関東」に置き換える、年齢を「10代」にする など

*6:出典 日本電信電話株式会社の発表資料( (リンク ») )

*7:Pk-匿名化技術
 データの一部分を確率的に書き換えるランダム化の処理と、元の状態を推定する再構築という処理により、理論的にk-匿名性を満たしつつ、元のデータの統計的性質をなるべく保った有用性の高いデータを作成します。

本プレスリリースは発表元企業よりご投稿いただいた情報を掲載しております。
お問い合わせにつきましては発表元企業までお願いいたします。

【企業の皆様へ】企業情報を掲載・登録するには?

御社の企業情報・プレスリリース・イベント情報・製品情報などを登録するには、企業情報センターサービスへのお申し込みをいただく必要がございます。詳しくは以下のページをご覧ください。

ZDNET Japan クイックポール

注目している大規模言語モデル(LLM)を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]