OpenAIは、「X」(旧Twitter)への投稿を通じて、無料ユーザーも有料ユーザーも、「OpenAI o3-mini」が結論に達するまでに経た推論プロセスを可視化できるようになったと発表した。例えば、Xへの投稿では、「今日はどうして金曜ではないの?」というユーザーの質問に対して、所要時間を示すドロップダウンの下に、回答に至るまでの思考の連鎖の全段階をo3-miniが示している。
Updated chain of thought in OpenAI o3-mini for free and paid users, and in o3-mini-high for paid users. pic.twitter.com/uF4XTBGpC5
— OpenAI (@OpenAI) February 6, 2025
o3-miniがどのようにして結論に達したかが分かれば、ユーザーが結論の精度を検証する助けになるだけでなく、モデルがどうやって回答にたどり着いたかをユーザーに教えてくれるため、役に立つ。これは特に、数学やコーディングのプロンプトにおいて有用で、全段階を確認することで、ユーザーが次に同様の問題に出会った際、その過程をなぞることで自ら正解に至れるかもしれない。
「ChatGPT」の有料ユーザーは、「high reasoning(高度な推論)」オプションでo3-miniのアップデートされた思考の連鎖も可視化できる。オプション名が示すように、「high reasoning」では、より高度な推論が求められる高度な質問に、より多くのコンピューティングパワーを利用できる。
「思考の連鎖」(Chain of Thought:CoT)とは?
新機能を発表するXへの投稿で、OpenAIは「思考の連鎖」という用語を用いているが、これは実際には何を意味するのだろうか?
推論を段階に分けて説明するよう人に求めるのと同じ方法で、CoTプロンプティングは大規模言語モデルに対して、複雑な問題をもっと小さな論理的で解決可能なステップに分割するよう促す。こうした推論のステップをユーザーと共有することにより、大規模言語モデルはさらに解釈可能なものになり、ユーザーは回答をより上手に導き、推論の間違いを見極めることができる。
raw(生の)CoTは、モデルが問題を推論している時にすべての中間ステップをリアルタイムで表示する。OpenAIは今回のアップデートで、raw CoTを採用せず、ユーザーのために推論を要約している。そのため、多くのAIマニアがXへの投稿にコメントし、新機能への不満を表明している。モデルをより上手に誘導し、不正確な推論を修正できるなど、raw CoTには他にもメリットがあるからだ。
o3-mini is exceptionally great, but I do worry that summarized chain-of-thought is actually worse than nothing at all.
— Mckay Wrigley (@mckaywrigley) February 6, 2025
True CoT exposure acts as a prompt debugger. It helps us steer the model.
Summarized CoT obfuscates this and potentially adds errors - makes it hard to debug. https://t.co/cgz6ONCkvk

提供:ZDNET
この記事は海外Ziff Davis発の記事を朝日インタラクティブが日本向けに編集したものです。