OpenAI、リアルタイムAPIをプレミアム料金で提供へ--音声でのやり取りも可

Tiernan Ray （Special to ZDNET.com）翻訳校正：緒方亮長谷睦（ガリレオ）

2024-10-04 10:33

　OpenAIの開発者向け年次イベント「OpenAI DevDay」が米国時間10月2日にサンフランシスコで開催され、多くの製品と機能が発表された。今回の目玉は、リアルタイムのアプリケーションプログラミングインターフェース（API）の導入だった。

　この開発者向け機能によって、推論オペレーションの実施中、すなわち、プロダクション大規模言語モデル（LLM）で予測をしている最中に、音声言語による入出力の送受信が可能になる。こうしたタイプの情報のやり取りを導入することで、人間と言語モデルの間の会話が、より滑らかでリアルタイムなものになることが期待されている。

　ただし、この機能を使うにはかなりの追加料金がかかる。リアルタイムAPIのベースとなるモデルは、大規模言語モデル「GPT-4o」となるが、OpenAIの現行料金では、このモデルの料金は100万トークンあたり入力テキストで2.50ドル、出力テキストで10ドルに設定されている。

　一方、リアルタイムの入出力では、少なくともこの2倍の料金がかかる。リアルタイムAPIを使う場合、GPT-4oへのテキストでの入出力は、100万トークンあたり、入力に5ドル、出力に20ドルがかかる。