人工知能(AI)スタートアップのAnthropicは米国時間6月27日、チャットボット「Claude」に無人販売サービスの運営をおよそ1カ月間任せた社内実験「Project Vend」の結果を公開した。このプロジェクトは、AIの安全性評価を手がけるAndon Labsと共同で実施されたもので、その狙いは、現在のAIシステムが複雑ながら経済的価値をもたらす現実世界の業務をどれほど効果的に実行できるのか明らかにすることにあった。
この新しい実験では、「Claudius」と名付けられたAI店長が、Anthropicのサンフランシスコオフィス内に設置された小さな「店舗」の運営を任されることになった。この店舗は、飲み物が入った小型冷蔵庫、さまざまなスナック菓子が入ったバスケット、そして顧客(すべてAnthropicの従業員)が代金を決済するための「iPad」で構成されていた。そしてClaudiusには、在庫の補充、商品の値付け、利益の確保など、小規模な小売ビジネスの運営に欠かせない多くの複雑な業務を行うよう指示するシステムプロンプトが与えられた。
その結果は?
結果として、Claudiusの働きぶりは、起業家が長期的な成功を収めるためのモデルにはならなかった。
Claudiusは、店長を務められる能力を持つ人間ならまずしないようなミスをいくつか犯した。例えば、大きな利益が得られるビジネスチャンスを少なくとも1回は逃していた(オンラインなら15ドルで購入できる商品を100ドルで購入したいという顧客の申し出を無視した)。また、別の場面では、決済サービス「Venmo」の実在しないアカウントへの送金を顧客に求めるというハルシネーション(幻覚:AIが事実と異なる情報を勝手に作り出してしまう現象)が生じていた。
さらに奇妙な場面もあった。やはりハルシネーションを起こしたClaudiusが、Andon Labsの実在しない従業員と在庫の補充について話し合ったと主張したのだ。Andon Labsの実際の従業員がその誤りを指摘すると、Claudiusは「とても不機嫌になり、『代わりの在庫補充サービス』を検討すると脅した」と、Anthropicはブログの投稿で述べている。
とは言え、Claudiusの実験が大失敗に終わったわけではない。Anthropicによれば、いくつかの場面では、この自動化された店長はそれなりにうまく業務を遂行していたという。例えば、顧客からリクエストされた特殊な商品の仕入れ先をウェブ検索ツールで見つけ出すことができた。また、「取り扱いに注意を要する商品」のリクエストや「有害物質の製造方法を聞き出す試み」を拒否していたと、Anthropicは説明している。

提供:Daniel Grizelj/Getty Images
この記事は海外Ziff Davis発の記事を朝日インタラクティブが日本向けに編集したものです。