日本ユニシスは11月16日、大学共同利用機関法人 情報・システム研究機構 国立情報学研究所(NII)が取り組む人工知能(AI)プロジェクト「ロボットは東大に入れるか」の本年度の研究活動に参加し、ベネッセコーポレーションから同プロジェクトに提供された「進研模試 総合学力マーク模試」の世界史Bに挑戦し、平均点を30点上回る76点(偏差値66.5)という好成績を修めたと発表した。
過去2年間の受験結果との得点比較(世界史B) ※日本ユニシスの成績は本年度(2015年度)の「東ロボくん」の成績のみ (ユニシス提供)
ロボットが東大に入れるかは、昭和50年代後半以降細分化されたAIの分野を再統合することで、AI研究の新たな地平を切り拓こうと2011年度に始められた。
大学入試センター試験の世界史の問題をコンピューターで解くためには、自然言語で記述されている教科書などを知識源として、各設問に記述されている質問文に対する適切な答えを解答群の中から正しく選択することが求められる。
自然言語処理分野の研究において、自然言語で記述された知識源に関する質問に答えるために有効とされる主な手法としては「含意関係認識技術の適用」「事実型質問応答技術の応用」「構文木(こうぶんぎ)の類似度評価」があり、日本ユニシスではこれらの手法に基づき、センター試験の世界史の観点から解法を独自に定式化して解答を導き出す仕組みを実装することで、今回の成果を達成した。
日本ユニシス総合技術研究所は2014年度、含意関係認識に関する同社の研究のベンチマークとして、NIIの情報アクセス技術の評価と性能比較のための研究基盤プロジェクト「情報検索システム評価用テストコレクション構築プロジェクト(NII Testbeds and Community for Information access Research、NTCIR:エンティサイル)」の含意関係認識部門(RITE-VAL)に参加し、文に含まれる単語の一致率に着目した機械学習と全文検索技術を駆使した含意関係認識システムを構築してトップの成績を収めた。
しかし、同部門で構築したシステムの実力を試すためにNTCIRの大学入試問題の世界史を解く部門(QALab)でセンター試験の過去問に挑戦した結果、同システムをそのまま適用しても正解を導き出せないケースがあることが分かったという。
このため、同研究所ではセンター試験の世界史の問題を改めて観察し、正解を導き出すために必要となる手法について検討を重ね、本年度、NTCIRのQALabに再挑戦することを通じて、NTCIRと協賛関係にあるロボットは東大に入れるかプロジェクトのセンター試験の世界史受験に取り組んだ。
センター試験の世界史では、解答群の各選択肢の文が意味する事柄が教科書などの知識源に含まれていれば正文、知識源から導き出すことができなければ誤文と判断する「正誤判定問題」が最も難易度が高く、出題の大部分を占めている。
日本ユニシス総合技術研究所では、知識源を有効に活用できるようにするため、教科書やWikipedia、イベントオントロジーEVTから問題に関係する箇所を局所的に抽出可能な全文検索システムを構築。
また、問題に含まれる人名、出来事名、地名といった固有表現が問題を解く上での鍵となるため、固有表現や語彙の意味関係の辞書を知識源から半自動で情報抽出することで拡充した。
その上で、正誤判定問題を解くため、以下の手法により解答を生成した。なお、この手法は、正誤判定問題のほかに、穴埋め問題、出来事が起こった年代順を答える問題にも適用することが可能。
今回、こうした既存の自然言語処理の手法をセンター試験の世界史に適応した形で再定式化し、これまでにない高得点を獲得することができた。ここで使用した世界史という特定ドメインへの適応の方策や手順などは、専門性が高い分野で精緻な情報が必要とされる場面において広く応用できるとユニシスでは考えている。
しかし一方で、過去問や模試での誤りを解析した結果、今回のアプローチ(知識源からの検索として解く手法)にも限界があることを感じており、さらに上を目指すには、より広い意味での常識や、きめ細やかな日本語運用能力などを備えた仕組みと組み合わせる必要があるとしている。
問題・解答の例(正誤判定問題)(ユニシス提供)
日本ユニシス総合技術研究所では、会議室などコミュニケーションの場として利用される空間が、その場の雰囲気や会話の文脈を理解し、状況に応じた情報を提示することで会話の進展をサポートできる「空間プラットフォーム」の実現を目指している。
現在は、人間がコミュニケーションを取るときの前提として共有している常識的な背景知識や感覚(コモンセンス)を備えるAIとしての「コモンセンスAI」を基にして、空間内で人とAIとが自然なインタフェースを介して相互作用できる環境の研究開発を進めているという。
今後は、会話の文脈を理解し、コミュニケーションの目的や内容に応じて、より専門性の高い精緻な知識や過去の正確な事象についての知識を備えるAIも必要となり、今回の取り組みで得られた研究成果とコモンセンスAIを融合させることで、空間プラットフォームの実現に一歩近づけることができると考えているとしている。