OpenAI、低コストの小型モデル「GPT-4o mini」の提供を開始

Tiernan Ray (Special to ZDNET.com) 翻訳校正: 緒方亮 長谷睦 (ガリレオ)

2024-07-19 10:33

 OpenAIは7月18日、大規模言語モデル(LLM)「GPT-4o」の小型版にあたる「GPT-4o mini」を発表した。OpenAIによると、GPT-4o miniは、「GPT-4」よりも精度が高く、開発者の使用時のコストを「GPT-3.5 Turbo」よりも大幅に低く抑えたバージョンで、AIモデルを広範に使用するアプリケーションの開発を加速させられるという。

 OpenAIはこの新しいAIモデルを「市場に出回っている中で最もコスト効率が高い小型モデル」とうたっているが、同社の大半の発表と同様に、GPT-4o miniの技術詳細(パラメーター数など)はまったく明かされていない。そのため、この発表で言う「小型」が具体的に何を意味するかははっきりしない。

 (「AIモデル」はAIプログラムの中でも、膨大な数のニューラルネットワークパラメーターと活性化関数を含む部分で、AIプログラムが機能する仕組みの中でも重要な要素とされる)

 OpenAIから米ZDNETにメールで送付されてきたブログ記事には、GPT-4o miniは「入力トークンは100万あたり15セント、出力トークンは100万あたり60セントと、これまでのフロンティアモデルよりも料金が1ケタ安く抑えられており、GPT-3.5 Turboよりも60%以上安い」とある。

 このコスト削減は活動のボリュームに影響を受けるアプリケーションの開発を後押しすると、OpenAIでは述べている。

 例えば、アプリケーションプログラミングインターフェース(API)を何度も呼び出さなければならないアプリケーション、素材をリトリーブするための「コンテキストウィンドウ」が大きいアプリケーション(アプリ開発時にコードベースを丸ごとリトリーブするなど)、ヘルプデスクでサポート業務を担うチャットボットのようにユーザーと頻繁にやりとりする必要があるアプリケーションなどが、1トランザクションあたりのコスト削減による恩恵を受けると、OpenAIは説明している。

 GPT-4o miniは、チャットボットとしての使用時には、GPT-4のスタンダードモデルのパフォーマンスを上回る(「LMSYS leaderboard」によるクラウドソーステストでの測定値)。また、「テクスチュアルインテリジェンスとマルチモーダル推論にまたがるアカデミックなベンチマークにおいて、GPT-3.5 Turboなどの小型モデルを上回っている」ほか、GPT-4oのスタンダードモデルと同じ数の言語に対応している。

 「マルチモーダル推論」の「MMU」テストのような一般的なAIベンチマークでも、GPT-4o miniモデルはほかのいくつかのモデルを上回り、GPT-4oのスタンダードモデルに迫るパフォーマンスを残している。

「マルチモーダル推論」の「MMU」テストのような一般的なAIベンチマークでも、GPT-4o miniモデルはほかのいくつかのモデルを上回り、GPT-4oのスタンダードモデルに迫るパフォーマンスを残している。提供:OpenAI
「マルチモーダル推論」の「MMU」テストのような一般的なAIベンチマークでも、GPT-4o miniモデルはほかのいくつかのモデルを上回り、GPT-4oのスタンダードモデルに迫るパフォーマンスを残している。
提供:OpenAI

 GPT-4o miniは「Assistants API」「Chat Completions API」「Batch API」を通じて、開発者向けに即時提供されているほか、「ChatGPT」の無料アカウント、ならびに「Plus」あるいは「Team」アカウントでも、GPT-3.5 Turboの代わりに使うこともできる。

 GPT-4o miniは現時点でテキストと画像にしか対応しておらず、音声と動画への対応を予定しているが、具体的な日付は明らかにされていない。GPT-4o miniのコンテキストウィンドウは12万8000トークンで、トレーニングデータは2023年10月までのものになっている。

提供:OpenAI
提供:OpenAI

この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    Pマーク改訂で何が変わり、何をすればいいのか?まずは改訂の概要と企業に求められる対応を理解しよう

  2. セキュリティ

    従来型のセキュリティでは太刀打ちできない「生成AIによるサイバー攻撃」撃退法のススメ

  3. 運用管理

    メールアラートは廃止すべき時が来た! IT運用担当者がゆとりを取り戻す5つの方法

  4. セキュリティ

    2025年はクラウドを標的にする攻撃が増加!?調査レポートに見る、今後警戒すべき攻撃トレンド

  5. セキュリティ

    最も警戒すべきセキュリティ脅威「ランサムウェア」対策として知っておくべきこと

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]