セガゲームスは、スマートデバイス向けゲーム開発において検証作業を自動化するために構築した人工知能(AI)システムを、深層強化学習を用いて改良した。6月12日、改良システムの開発を支援したブレインパッドが発表した。
深層強化学習とは、ゲームなど結果が出るまでに時間がかかるタスクや多数の繰り返しが必要になるタスクに対して、コンピューターが試行錯誤を繰り返しながら最適な戦略を学習する手法。2016年に囲碁の世界チャンピオンを破った英DeepMindの「AlphaGO(アルファ碁)」にも用いられている。
ブレインパッドは、セガゲームスのゲーム開発を支援するため、業界の中でも先進的な取り組みとして、深層強化学習を用いたAIシステムを開発した。これまでの研究で得られた知見をゲーム開発に応用した結果、リリース前のテスト作業やゲームバランスの調整などの多様な検証作業が高速に行えるようになり、ゲーム開発へリソースを集中できる環境構築とゲーム品質の向上が実現した。
深層強化学習を用いたゲームバランスの調整(出典:ブレインパッド)
セガゲームスでは、更新サイクルが早いスマートデバイス向けのゲームの開発で、ゲームのリリース前に不具合がないかを確認するテスト作業や、適切な難易度になっているかゲームバランスの確認を行う作業に多大な時間とコストがかかっていた。そこで、ゲームをテストプレイするAIシステムを独自開発し、一定の成果を挙げていたが、テストプレイの時間をより短縮するさらなる改善を検討していた。
強化学習エンジンは、シミュレーターと呼ばれる疑似装置を通してAIにゲームを学習させるが、シミュレーターと強化学習エンジンは異なるプログラム言語を使用しているため、両者を連携させるインターフェースの開発が必要となっていた。そこで、それぞれに専門性を有するデータサイエンティスト、機械学習エンジニア、システム開発を得意とするエンジニアがチームを組成し、新しいAIシステムの開発を行った。
これまでのシステムは、ゲームバランスの調整作業において、ゲームの前提条件を変えると再学習に時間を要する点が課題だったが、今回のAIシステムは、ゲームの前提条件を変更しても再学習が不要で、ゲームバランスの調整が短時間で行えるようになっている。