NTTテクノクロスは、NTT研究所の新たな匿名化技術を活用し、合成データ生成機能を搭載した匿名加工情報作成ソフトウェア「tasokarena(タソカレナ)」の新バージョンを11月17日に発売する。新バージョンの年間税別価格は、スタンダード版(GUI版)が60万円から、エンタープライズ版(スタンダード版+自動実行/データ連携機能)が180万円から。
新バージョンでは、元のパーソナルデータから特徴量や統計量、分布などが類似するデータを生成し、「実在しないが具体的なパーソナルデータ」(合成データ)を作り上げることができる。
この合成データ生成機能は、匿名性やプライバシーを守りつつ、分析に必要な元のデータの性質を保持したデータを生成するため、従来の匿名加工情報作成ソフトウェアによるパーソナルデータの一般化や削除、ランダム化されたデータと比べて、より緻密なデータ分析が可能になるという。
また、少ないデータから匿名化された大量の合成データを生成できるため、膨大なデータを必要とするAI(人工知能)の学習や訓練などに活用可能となる。
分析に必要な複数の統計値を保持する多属性の合成データの生成は、NTT社会情報研究所の特許技術である合成データ生成技術の活用によって実現した。同技術により、各属性の平均など統計値が元データとほぼ等しい合成データを生成する技術などを独自に開発することができた。