はじめに
前回に続いて、2021年に公開された論文「Acquisition of Chess Knowledge in AlphaZero」を元にして、強化学習を適用したニューラルネットワークの「学習内容」を分析するという研究事例を紹介します。今回は、学習済みのニューラルネットワークは「人間のプレイヤーと同じ考え方を持っているのか」という点の分析になります。
Stockfishの評価関数
学習済みの機械学習モデルが「人間のプレイヤーと同じ考え方」を持つかどうかを分析するには、まずは、「人間のプレイヤーの考え方」をモデル化する必要があります。冒頭の論文では、「Stockfish(ストックフィッシュ)の評価関数」をそのモデルとして利用しています。これは、Stockfishと呼ばれるオープンソースのチェスエンジンで採用されているもので、与えられたチェスの盤面に対して、一定のルールで複数の「スコア」を計算して、そのスコアを元にして、その盤面の価値(その盤面が自分にとってどの程度有利かを表す数値)を計算します。スコアは、「material(それぞれの駒の位置)」「imbalance(持ち駒の差異)」「mobility(駒の動きやすさ)」「king_safety(キングの安全性)」などの要素を個別に点数化したもので、人間のプレイヤーが盤面から読み取る一般的な情報に対応しています。
この続きは以下をご覧ください
(リンク »)
お問い合わせにつきましては発表元企業までお願いいたします。