アドバンスト・メディアは7月12日、携帯電話向けに音声認識機能付きコンテンツを実現するASPサービス「AmiVoice DSR for Mobile Contents」の提供開始を発表した。
AmiVoice DSRは、携帯電話端末向けのクライアント「AmiVoice DSR Client」とサーバ向けの「AmiVoice DSR Server」という2つのソフトを組み合わせて、音声認識を実現する。クライアントとサーバで分散処理することで、携帯電話に負担をかけない音声認識システムを構築できる。
同サービスは、AmiVoice DSR ServerをインストールしたサーバをASP方式で提供する。コンテンツプロバイダがAmiVoice DSR Clientを組み込んだクライアントアプリケーションを作成すれば、エンドユーザーへの音声認識機能付きコンテンツ提供が可能となる。ASP利用料金はコンテンツプロバイダが定額で支払い、エンドユーザーに対する直接課金は行わない。
音声認識を実行するにあたり、音声データそのものではなく約30分の1に圧縮された特徴データを送信するので、クライアントには約20MIPSの負荷しか要求しないという。また、特徴データはサイズが小さいことから、8kbps程度の通信速度でもほぼリアルタイムに認識できる。
音声認識用の言語モデルと辞書はサーバ側に持たせるため、「メンテナンスが容易で、5万語以上という非常に大きな辞書と言語モデルを複数動作させるアプリケーションも作れる」(同社)。
現時点で対応している携帯電話は、NTTドコモのFOMA「M1000」とボーダフォン「702NK」のみ。同社では、対応機種を順次拡充するとしている。