東京都市大学は4月8日、情報工学部 知能情報工学科の塩本公平教授が人工知能(AI)技術を用いてマルウェアを検出するシステムを開発したと発表した。従来の0.1%程度のサンプルデータで約82%のマルウェアを検出できるとしている。
同大学によると、開発したシステムでは「半教師あり」の機械学習アルゴリズムを用いている。事前に特徴量を決め、マルウェアが感染する場合と感染しない場合について少量のパケット通信パターンをサンプルとして選び、特徴量を学習させる。全ての通信パターンの特徴量の分布状況を学習結果に反映することで、少量のサンプルデータでも良い精度でマルウェア感染するパターンを検出できるという。
塩本教授の研究では、敵対的自己符号化器を用いて今回のシステムを開発し、実際のパケット通信データを用いて有効性を検証したところ、従来の0.1%程度の量のサンプルデータで約82%の検出率が確認された。4月20日から開催される国際会議「2020 IEEE/IFIP Network Operations and Management Symposium」で成果の一部を発表するという。
![評価結果(出典:東京都市大学)](/storage/2020/04/08/55a289b57fe005698cd8a0e15c53ee4f/tokyotoshiuniv01.jpg)
評価結果(出典:東京都市大学)
従来のマルウェア検出は、個々のマルウェアの特徴をとらえるパターンマッチングや振る舞い検知などさまざまな手法が使われているが、検出のために膨大な量のサンプルデータを必要とする。塩本教授の研究では、このデータを少量にすることで、膨大なサンプルデータを扱うのが難しいPCやルーターなどの機器でも効率的なマルウェア検出が可能になると期待される。
今後はその他のデータセットでも効果を検証し、1~2年後の実用化を目指すという。