2023年までは、Googleをはじめとする先進的な人工知能(AI)企業によってリリースされる新たなAIプログラムのリサーチレポートを読むだけで、さまざまなAIテクノロジーについて学ぶことができた。AI分野には情報をオープンなかたちで公開するのが当たり前という風潮があったのだ。
提供:Maria Diaz/米ZDNET
しかし、3月にOpenAIが同社の最新プログラム「GPT-4」を発表したことをきっかけに、このような風潮は大きく変わり、技術的な詳細はほとんど明かされないようになった。同社が発表したリサーチペーパーでは、他の研究者がGPT-4の構造を理解し、類似の物を構築する上で必要となる重要な詳細がすべて非公開となっていた。
Googleは米国時間12月6日、Google DeepMindと共同で開発し、5月に発表していた最新の生成型AIプログラム「Gemini」を正式にリリースしたものの、詳細情報を非公開にするという方針を堅持した。GoogleとDeepMindの研究者らは、ブログ投稿とリサーチレポートを公開したが、ブログ投稿に技術的な詳細はなく、リサーチレポートにも関連する技術的な詳細はほとんど含まれていなかった。
これらの文書には、一連のベンチマークテストの結果が数多く引用されている。それによると、GeminiはほとんどのスコアでOpenAIのGPT-4を上回っており、それまでGoogle最新のニューラルネットワークであった「PaLM」をも上回っているという。
しかし、同社のブログとリサーチレポートには、従来であれば記載されることが通例だった、プログラムに搭載されているニューラルネットワークの「パラメーター」数、すなわち「ウェイト」(重み付け)の数といった、プログラムの設計や機能の重要な側面を表す詳細が含まれていない。その代わりに、Geminiの「Ultra」と「Pro」「Nano」というサイズの異なる3つのバージョンについて言及されている。そして、このリサーチレポートにはNanoが18億と32億5000万という2種類のウェイト数で訓練されているという記述があるものの、UltraとProのウェイト数についての記述はない。
その他数多くの技術的詳細も、OpenAIのGPT-4に関するリサーチペーパーと歩調を合わせているかのように開示されていない。こういった技術的詳細が非開示となっている中、ベンチマーク結果を主張することに何の意味があるのかという議論がネット上で沸き起こっている。