大学共同利用機関法人情報・システム研究機構 国立情報学研究所(NII)および、富士通研究所とサイバネットシステムは11月14日、国立大学法人名古屋大学、国立大学法人東京大学と共同で、NIIの人工知能(AI)プロジェクト「ロボットは東大に入れるか」(東ロボ)において、東京大学第2次学力試験に向けた論述式模試とマークシート式の大学入試センター試験模試に挑戦し、昨年度を大幅に上回る成績を挙げたと発表した。論述式模試の数学(理系)で偏差値76.2、センター試験模試の物理では偏差値59.0だったとのこと。
東ロボの今回の取り組みの概要と成果は以下の通り。
- 数学
- 物理
今年の数学チームはNII、富士通研究所、名古屋大学を中心に構成され、解答プロセスの前半にあたる自然言語処理部分を名古屋大学を中心とするグループ、後半の数式処理部分を富士通研究所を中心とするグループが担当した。
数学においては昨年度まで、限量記号消去と呼ばれる数式の変形を繰り返す技術を適用したソルバで問題を解いていた。この手法は多項式の等式・不等式を扱う実数問題に対する汎用的な解法であり、広範な単元の問題を解くことができるものの、三角関数を含む問題には直接適用できず白紙回答になることがあったという。
それに対し今年度は、数式処理部分において、これまで解けなかった三角関数の問題のうち入試問題によくあらわれるタイプの問題に対して、限量記号消去を適用できる形に変換して解く技術を開発し、ソルバの対応できる問題を拡大した。
また、言語処理部分では数式解析部と文間関係解析部の開発、文法と辞書の拡充、および構文解析技術の改良などの言語処理の機能拡張により、自動で解ける問題の範囲を広げた。これにより、昨年度までは一部で人の手を介していたが、今回は完全に自動で回答できるようになっている。
数学問題を解く手順。言語理解部、数式の変形によるソルバ部が今年度機能拡張した部分
こうした改良の結果、昨年度受験した駿台予備学校の論述式模試・数学(理系)では偏差値44.3(20点)という結果だったのに対し、今年挑戦した代々木ゼミナールの論述式模試「東大入試プレ」の数学(理系)では、問題文を入力後、問題文の解釈から自動求解、解答の作成までをAIにより完全に自動で行い、6問中4問を完答、120点満点中80点の偏差値76.2と大幅に成績を伸ばした。
東大2次試験に向けた模試(数学)の偏差値の推移
一方の物理チームは、富士通研究所、サイバネット、東京大学を中心に構成され、従来の技術に数学チームで確立した技術を加えて挑戦した。
物理の試験に対しては昨年度まで、AIが問題テキストを言語処理技術により解析して内部形式に変換し、それを元に物理シミュレーションの初期条件を構築し、シミュレーション結果から回答する、というシステムを目指して研究開発を行ってきた。この昨年度までの開発により、シミュレーションの初期条件を人が設定すれば物理現象を再現することで一部の入試問題が解けることは確認できていたが、人の解釈が必要なため、内部形式からの自動化は達成できていなかった。
それに対し今年度は、言語処理が生成可能と想定される内部形式からその状況を表す条件式を構築し、それを限量記号消去で解いてシミュレーションの初期条件を生成する技術を開発。また入試問題用のシミュレーションの部品の追加や、入試問題では初期条件が答えそのものになる「つりあいの問題」などシミュレータには扱いづらい問題に対して画像の情報も利用して解く専用のソルバを開発している。
物理問題を解く手順。青、赤で囲まれた部分がそれぞれ2015年度、2016年度の模試において自動で動作した範囲
物理チームが挑戦した試験は、昨年度と同じベネッセコーポレーションのセンター試験模試「進研模試 総合学力マーク模試」。シミュレーションの設定において一部で人が介入したものの、昨年度より自動化の範囲を広げた課題設定とした。現時点の自然言語処理技術と画像処理技術を用いれば生成可能と想定される内部形式から、AIによる自動求解の結果、100点満点中62点で偏差値59.0を達成。昨年度に対し偏差値で12.5ポイント、得点は20点向上した。
入試センター模試(物理)の偏差値と点数の推移