xAI、大規模言語モデルの最新版「Grok-2」を早期プレビューでリリース

Sabrina Ortiz (ZDNET.com) 翻訳校正: 編集部

2024-08-15 10:37

 Elon Musk氏が設立したAI企業のxAIは米国時間8月13日、最新の大規模言語モデル(LLM)「Grok-2」の早期プレビューをリリースした。Grok-2の軽量版である「Grok-2 mini」も含まれる。

 今回のリリースに先立ち、Grok-2の初期バージョンはLarge Model Systems Organization(LMSYS)のChatbot Arenaで匿名テスト(その際の名称は「sus-column-r」)が実施されていた。

 LMSYSでは、ユーザーがLLMの名前を知ることなく、2つのLLMのチャット画面を並べてその応答を評価することができる。OpenAIの「GPT-4o」やGoogleの「Gemini 1.5 Pro」のようなLLMと比較した場合、Grok-2は「Overall(総合)」部門で3位、GPT-4oと同等という結果だった。


 Chatbot ArenaのLeaderboardにアクセスしても同じ結果は表示されないが、LMSYSは「X」(旧Twitter)で初期の結果を投稿していることを明らかにしている。

 その他の注目すべき結果としては、Grok-2の「Math(数学)」と「Coding(コーディング)」部門で2位、「Hard Prompts(ハードプロンプト)」では4位だった。Chatbot Arenaで実際にテストするには、ウェブサイトにアクセスして「Arena(side-by-side)」をクリックし、サンプルプロンプトを入力すればいい。

 xAIはまた、「Massive Multitask Language Understanding(MMLU)」や「MATH」といったベンチマークでもGrok-2の性能を評価している。その結果は、前身の「Grok 1.5」よりも優れ、GPT-4o、「Claude 3 Opus」「Llama 3」などのLLMと対抗するものだったという。

提供:xAI 提供:xAI
※クリックすると拡大画像が見られます

 Grok 2は、高度なテキスト生成に加え、Black Forest Labsの画像生成モデル「FLUX.1」との連携により、高品質な画像も生成することができる。

 市場に出回っている多くの画像生成ツールは、有名人や政治家などの公人が登場する画像の作成に厳しい制限を設けているが、Grok-2にはそのような制限が設けられておらず、既に多くのベータテスターが下記のような政治家の画像を作成している。


 生成された画像は高品質でリアルだが、画像がAIによって生成されたことを明らかにするような情報開示はないようだ。

 Grok-2とGrok-2 miniは、Xのプレミアムとプレミアムプラスのユーザーにベータ版として提供される。どちらのモデルも、8月末に新しいエンタープライズAPIプラットフォームを通じて開発者向けにリリースされる予定だ。

提供:SOPA Images / Contributor / Getty Images
提供:SOPA Images / Contributor / Getty Images

この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    セキュリティに対する意識や対策状況の違いが浮き彫り--日米豪における情報セキュリティの実態を調査

  2. セキュリティ

    セキュアな業務環境を実現する新標準「Chrome Enterprise Premium」活用ガイド

  3. セキュリティ

    「脱VPN」で実現するゼロトラストセキュリティ!VPNの課題を解消し、安全なリモートアクセスを確立

  4. ビジネスアプリケーション

    ITR調査レポートから紐解く、間違いだらけのDX人材育成--研修だけでは成果にならないその理由は?

  5. セキュリティ

    もはや安全ではないVPN--最新動向に見る「中小企業がランサムウェア被害に遭いやすい」理由

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]