「ChatGPT」、「Record Mode」を追加--音声のテキスト化と要約が可能に

Webb Wright (Special to ZDNET.com) 矢倉美登里 吉武稔夫 (ガリレオ)

2025-06-23 09:46

 人工知能(AI)は耳を澄ませている。これからは、さらに鋭く。

 OpenAIは米国時間6月19日、「X」への投稿で、「ChatGPT Pro」「ChatGPT Enterprise」「ChatGPT Edu」のユーザーはボタンを押すだけで音声を録音できるようになったと発表した。新機能「Record Mode」は、文字起こしアプリ「Otter」のように会話をテキスト化する機能で、最初は6月に「ChatGPT」の「macOS」版デスクトップアプリを通じてリリースされた


 Record Modeを利用すれば、「iPhone」の音声録音アプリ「ボイスメモ」やOtterのようなサードパーティー製ツールを使うのと同じように、会議の内容や音声メモを録音できる。録音された音声は、ChatGPTがテキストに変換して要約し、ユーザーのチャット履歴に「Canvas」として保存される。それを、パーソナライズされた電子メールやコンピューターのコードなど、違う種類の出力データに変換するようChatGPTに指示することも可能だ。

 Record Modeを利用するには、ChatGPTがデバイスのマイクにアクセスできるようにしておく。その後はChatGPTのユーザーインターフェースの最下部にある「Record」ボタンをクリックするだけでいい。ユーザーが話した通りにChatGPTがテキストに変換してくれる。テキストのプロンプトを入力する場合と同様に、自然言語で話せばいい。

 録音が終わったら、「Send」をクリックする。すると、新しいCanvasページが開いて録音された音声の要約が表示される。このテキストは、手作業で編集したり、ChatGPTに調整や別のフォーマットへの変換を指示したりできる。

 録音できるのは最大2時間までで、それを過ぎると自動的に録音を終了して、テキスト化した要約への変換が始まる。今のところRecord Modeが最も力を発揮できるのは英語だが、それ以外の言語でも能力を高めている、とOpenAIは述べている。

 OpenAIのウェブサイトによれば、録音された音声は、テキストに変換された直後にすべて削除されるという。同社はまた、ChatGPTユーザーの送信した音声ファイルがモデルのトレーニングに使用されることはないと説明している。

 だが、ChatGPTのユーザー設定で「すべての人のためにモデルを改善する」機能を無効にしていない場合は、Record Modeで作成されたトランスクリプトとキャンバスが、OpenAIによってモデルのトレーニングに利用される可能性がある。この機能の無効化に関しては、こちらに詳しい説明がある。

 ChatGPT Enterprise、「ChatGPT Team」、ChatGPT Eduのユーザーは、設定で「Workplace Controls」をクリックすれば、録音モードを無効にできる。

提供:Getty Images/Fahmi Ruddin Hidayat
提供:Getty Images/Fahmi Ruddin Hidayat

この記事は海外Ziff Davis発の記事を朝日インタラクティブが日本向けに編集したものです。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]