「AIデータ活用コンソーシアム」が3月6日に発足した。研究・教育機関、団体、企業などが集まり、人工知能(AI)の研究や開発に必要なデータ(AIデータ)の流通環境を整える。会長には、国立国会図書館長や国際高等研究所所長を歴任した元京都大学総長の長尾真氏が就任し、4月から活動を始める。
AIデータ活用コンソーシアムの会長に就任する長尾真氏
企業などでAIの研究や活用が活発になるのに伴い、大量かつ高品質のデータへのニーズが高まっている。学習データの量や偏りなどにより、生成されたアルゴリズムの品質が左右される。また、個人情報や権利関係の取り扱いなど、より一層の配慮が求められている。
データを共有・取引するための基盤整備は米国と中国が先行しており、日本は大きく後れを取っている。「AIの研究・開発を滞らせるだけでなく、AIを用いたオープンイノベーションや社会問題の解決に向けた重大な障害になっている」と長尾氏は危機感を募らせる。
現在、AIの研究開発やビジネス活用を前提にデータを集めるには、データホルダー(保有者)ごとに費用や契約などの交渉と手続きが必要になる。また、AI活用を前提とした商取引のガイドラインが十分に整備されておらず、事例も限られることから、公正な取引環境の確立が求められているという。
組織の垣根を越えて無償・有償で提供されるデータへのアクセスを容易にすることで、これまで困難であった複数のモダリティ(マルチモーダル)によるモデル構築を可能となる
コンソーシアムでは、(1)知的財産、(2)法令、(3)データ共有基盤をテーマとした作業部会(WG)を設置し、AIデータの活用に関する課題を検討・解決する。
具体的には、(1)は機械学習で使用するデータ、AIによって生成されるデータの権利関係を検討する。(2)は海外で進むゲノム・個人情報を含むデータ活用における法令、ガイドラインの調査・検討を進める。(3)は多種多様なデータを共有する上で求められるサービス基盤を検討する。
「ワンストップでデータの取引ができるサービスの提供や契約手続きなどの簡素化、会員間の連携による企業・人材のマッチングとネットワーキング、組織内のデータ基盤の構築など、データを集めて、円滑に流通できる仕組みを作っていく」(日本マイクロソフト 業務執行役員 NTO 田丸健三郎氏)
コンソーシアムが実装するデータ流通基盤は、組織内のデータ共有基盤としても利用可能で、会員には無償でライセンスされる。なお、コンソーシアムへの入会や会費といった詳細については4月以降に順次発表するとしている。
また、公共交通オープンデータ協議会と連携し、パイロットプロジェクトを開始することを明らかにしている。同協議会は、鉄道、バス、航空の分野において、公共交通関連データのオープン化に向けた活動を行っている。さまざまな交通機関のデータをワンストップで提供する「公共交通オープンデータセンター」の構築を目指している。パイロットプロジェクトでは、公共交通オープンデータセンターと連携することで、円滑なデータ流通の実現を目指す。
発起人の一覧