中国発の人工知能(AI)スタートアップであるDeepSeekの勢いは、今しばらく衰えることがなさそうだ。
DeepSeekはAppleの「App Store」で最も多くダウンロードされた無料アプリの座を「ChatGPT」から奪ったが、その直後の米国時間1月27日、テキストから画像を生成できるマルチモーダルAIモデル「Janus-Pro」をリリースした。DeepSeekの主力モデルである「DeepSeek-R1」と同じく、Janus-ProもMITライセンスの下でオープンソース化されており(商業利用が可能)、「HuggingFace」や「GitHub」からダウンロードできる。
R1をリリースしたときと同様、DeepSeekは2つのバージョンのJanus-Proをリリースした。そのパラメーター数は10億および70億だ。DeepSeekは独自テストの結果を公開し、パラメーター数の多い「Janus-Pro-7B」は、「GenEval」と「DPG-Bench」のベンチマークで、Stability AIの「Stable Diffusion」やOpenAIの「DALL-E」など、定評ある画像生成モデルを上回ったと主張している。
また、このモデルは「自己回帰フレームワーク」を使用しており、統合モデルを「凌駕する」ものだと述べている。

提供:DeepSeek
Janus-Proは、2024年にリリースされた最初の「Janus」をベースに構築されており、画像の生成と解析が可能だ。ただし、パラメーター数の少ない方のモデルは、解像度が384×384の画像の解析に制限されているのが欠点だ。
とはいえ、Janus-Proの性能はそれでも競争力がある。米国のAI企業の製品と比べてDeepSeekのトレーニングコストが低いと報告されている点を考慮すれば、なおさらだ。DeepSeekは2024年12月に発表した研究論文で、「DeepSeek-V3」モデルの開発コストはわずか560万ドル(約8億7000万円)で、GoogleやOpenAIが主力モデルに費やしたコストに比べればごくわずかに過ぎないと主張していた。もっとも、この金額については、(研究開発費、データコスト、人的コストが除外されているため)不完全だとする指摘や信じがたいと疑問視する声も上がっている。

Screenshot by Radhika Rajkumar/ZDNET
一方、NVIDIAはCNBCの取材でこのモデルについて、「優れたAIの進歩」とまで述べている。DeepSeekが他にも次々と製品をリリースする中、このモデルファミリーの第一印象はさまざまだが、全体的にはポジティブなようだ。ただし、自分たちの手でJanus-Proと他の画像モデルを比較テストするユーザーが増えるにつれて、印象は変化するかもしれない。
米ZDNETも、DeepSeekのアプローチが米国の競合各社よりエネルギー効率が高いという報告について調査している。もしこれが本当なら、AI業界やAI分野への投資にとって、さらに大きな転換点となるだろう。Janus-Proのリリースは、複数の大手AI企業が参画し、米Trump政権が宣伝している5000億ドル(約78兆円)規模のイニシアチブ「Stargate Project」のような計画に疑問を投げかけている。競争力のあるAIがあれば、このイニシアチブで提案されているほどのエネルギーや大規模データセンターが不要になる可能性があるからだ。

提供:marian/Getty Images
この記事は海外Ziff Davis発の記事を朝日インタラクティブが日本向けに編集したものです。