「ChatGPT」の「高度な音声モード」、ウェブ版でも利用可能に

Sabrina Ortiz (ZDNET.com) 翻訳校正: 緒方亮 吉武稔夫 (ガリレオ)

2024-11-21 10:00

 日々のワークフローに「ChatGPT」を活用している人は、デスクトップにChatGPTのタブを常に開いておくのが当たり前になっているかもしれない。今回、デスクトップからOpenAIの高度な音声モード「Advanced Voice Mode」をウェブ版ChatGPTで利用できるようになった。これは使うべきだ。

 OpenAIは米国時間11月19日、Advanced Voice Modeのウェブへの導入を順次開始して、デスクトップアプリとモバイルアプリ以外でも音声アシスタント機能を使えるようにすることを、「X」(旧Twitter)への投稿で発表した。アプリのダウンロードという利用のハードルが取り除かれ、Advanced Voice Modeがこれまで以上に利用しやすくなる。


 Advanced Voice Modeとは、OpenAIのAIを駆使した音声アシスタント機能のことだ。さらに自然で有益な会話を目指しており、アシスタントが話している途中でも口を挟むことができるほか、マルチターンの会話をしたり、ユーザーの気分に合わせて反応したりできる。音声アシスタントにありがちな、言われたことを理解するのにもたついてしまうという問題に対処している。

 できすぎた話に聞こえるかもしれないが、筆者が試した範囲では、Advanced Voice Modeは長い会話に堪能で、筆者の思考が一直線に進まなくても、言わんとしているところをうまく理解してくれる。日々の出来事に関するおしゃべり、雑学クイズ、自分語りなどに気軽に使える。もちろん、通常の音声アシスタントのように、実用的な使い方も可能だ。

 残念ながら、利用できる環境は拡大したものの、使うには従来通り月額20ドル(約3100円)の「ChatGPT Plus」に登録する必要がある。ChatGPTをよく使うのであれば、ChatGPT Plusにアップグレードする価値はあるだろう。「o1-preview」をはじめとするOpenAIの最新モデルをすべて利用できる、「GPT-4o」で送信できるメッセージの量が5倍になる、画像を生成できるといった特典があるからだ。

 Advanced Voice Modeのマルチモーダル機能はまだ利用できず、画面に表示された内容に対応したり、スマートフォンのカメラからコンテキストを判断して返答したりといったことはできない。マルチモーダル機能について、OpenAIは公開日をまだ明らかにしていない。

提供:Volha Yemialyantsava/Getty Images
提供:Volha Yemialyantsava/Getty Images

この記事は海外Ziff Davis発の記事を朝日インタラクティブが日本向けに編集したものです。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    最も警戒すべきセキュリティ脅威「ランサムウェア」対策として知っておくべきこと

  2. セキュリティ

    AIサイバー攻撃の増加でフォーティネットが提言、高いセキュリティ意識を実現するトレーニングの重要性

  3. 運用管理

    メールアラートは廃止すべき時が来た! IT運用担当者がゆとりを取り戻す5つの方法

  4. セキュリティ

    「どこから手を付ければよいかわからない」が約半数--セキュリティ運用の自動化導入に向けた実践ガイド

  5. ビジネスアプリケーション

    新規アポ率が従来の20倍になった、中小企業のDX奮闘記--ツール活用と効率化がカギ

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]