コンピューターと単独で協働できるAIモデルを想像してほしい。そんなAIが登場した。Anthropicは米国時間10月22日、AIモデル「Claude 3.5 Sonnet」の最新版でコンピューターを操作できるようになったと発表した。現在、同機能はAPIを通じて開発者が利用できるベータ版としてリリースされている。
Anthropicは、Claude 3.5 Sonnetについて「パブリックベータ版でコンピューターの利用を提供する初のフロンティアAIモデル」と宣伝している。Claude 3.5 Sonnetは、API経由でコンピューターを連動することができる。例えば、コンピューターの画面を見たり、画面上でカーソルを動かしたり、ボタンをクリックしたり、仮想キーボードでテキストを入力したりすることが可能だ。
現時点で同機能が実験段階であることは明らかで、エラーなどを引き起こす可能性がある。しかし、Anthropicは開発者からのフィードバックを得ることで、時間をかけてモデルを改善できるようベータ版をリリースした。
「現代の仕事の大部分は、コンピューターを介して行われている。AIが人間と同じようにコンピューターソフトウェアと直接対話できるようになれば、現世代のAIアシスタントには不可能な、膨大なアプリケーションの可能性が開けるだろう」
同社はまた、「Claudeが個々のタスクを完了するのを助ける特定のツールを作るのではなく、一般的なコンピュータースキルを教えることで、人間用に設計された標準的なツールやソフトウェアプログラムを幅広く使えるようにしている。開発者は、反復的なプロセスの自動化やソフトウェアの構築・テスト、調査のような終わりのないタスクにこの機能を使用できる」と説明する。
Anthropicによれば、既に幾つかの企業がClaude 3.5 Sonnetのコンピューター処理能力を利用しており、その中にはAsana、Canva、Cognition、DoorDash、Replit、The Browser Companyが含まれるという。
OSWorldのベンチマークテストでは、AIモデルがコンピューターを使用する試みを評価し、Claude 3.5 Sonnetは14.9%の成績を収めた。これは、人間レベルの70〜75%のスキルよりはるかに低いが、同じカテゴリーで次に優れたAIモデルが獲得した7.7%のほぼ2倍である、とAnthropic社は述べている。
AIによるコンピューター使用の試みは、まだ初期段階にある。そのため、Claudeはウィンドウのドラッグや画面のズームなど、より「高度な」コンピュータータスクはできない。また、Claudeがコンピューターと連携することで、特定のアクションや通知を見逃す可能性もある。
Anthropicは「コンピューター使用が急速に改善され、より速く、より信頼できるものになり、ユーザーが完了したいタスクにとってより有用なものになることを期待している」と語った。「また、ソフトウェア開発の経験が浅い人にとっても、より簡単に実装できるようになるだろう。Claudeの新機能が適切な安全対策を伴っていることを確認するため、研究者たちはあらゆる段階で安全チームと緊密に連携している」
開発者は、「Anthropic API」や「Amazon Bedrock」、Google Cloudの「Vertex AI」から、コンピューター使用のベータ版を活用したアプリケーションを構築することができる。
提供:Anthropic
この記事は海外Ziff Davis発の記事を朝日インタラクティブが日本向けに編集したものです。