はじめに
前回に続いて、2021年に公開された論文「Acquisition of Chess Knowledge in AlphaZero」を元にして、強化学習を適用したニューラルネットワークの「学習内容」を分析するという研究事例を紹介します。今回は、学習済みの機械学習モデルが持つ「人間のプレイヤーとは異なる独自の視点」に関する分析例を紹介します。
Matrix Factorizationによる「隠されたグループ」の発見
前回の記事では、学習済みのニューラルネットワークが「人間のプレイヤーと同じ考え方」を持っているかを分析する例を紹介しました。そこでは、Stockfishの評価関数を「人間のプレイヤーの考え方」を表すモデルとして、各ブロックが出力する特徴量の一次関数でこれらの評価関数が再現できるかどうかを検証しました。一方、今回は、教師無し学習の手法であるMatrix Factorizationを利用することで、これらの特徴量に内在する情報を取り出すことを試みます。具体的な中身を理解する準備として、まずは、一般的なMatrix Factorizationの考え方を説明しておきましょう。
Matrix Factorizationの例としてよく取り上げられるのが、映画の評価データ(図1)を用いて、映画群の「隠されたグループ」を発見するというものです。
この続きは以下をご覧ください
(リンク »)
お問い合わせにつきましては発表元企業までお願いいたします。

