編集部からのお知らせ
解説集:台頭するロボット市場のいま
解説集:データ活用で考えるデータの選び方

グーグル「Cloud Text-to-Speech」がGAに--WaveNetの新音声も追加

Stephanie Condon (ZDNet.com) 翻訳校正: 編集部

2018-08-29 11:26

 Google Cloudは米国時間8月28日、「Google Cloud Platform」(GCP)上で動作する、テキストの音声合成サービス「Google Cloud Text-to-Speech API」の一般提供開始を発表した。このAPIを利用することで開発者は、自らの開発するデバイスやアプリケーションに自然な音声を付加できるようになる。また、このAPIは特殊なデバイス向けに最適化した音声を合成する機能も提供している。さらに、新たな「WaveNet」音声が複数追加され、より多くの言語とさまざまな種類の音声がサポートされるようになっている。

 Googleは3月、Text-to-Speechを発表し、DeepMind買収の成果をいかに活用できるのかについて示して見せた。DeepMindは、ディープニューラルネットワーク(DNN)を用いて生の音声を合成するWaveNetという技術を生み出した企業だ。WaveNetを用いることで、標準的なテキスト音声合成技術を用いる場合よりも自然な音声を合成できる。

 Text-to-Speechの発表以来、WaveNet音声ポートフォリオを米国英語以外に拡大することを求める顧客の声が多かったという。今回一般提供が開始されたAPIでは、新たなWaveNet音声として米国英語のほか、英国英語とオーストラリア英語、フランス語、ドイツ語、オランダ語、イタリア語、韓国語、日本語で26の音声がサポートされている。

 Text-to-Speech APIでは、標準音声として用意されているものを含めると、14種類の言語やその方言による56種類の音声がサポートされている。

 Cloud Text-to-Speechの主な競合は、Amazon Web Services(AWS)の「Amazon Polly」だろう。

 またGoogleは、「Audio Profiles」のベータ版の提供も開始した。この機能を利用することで開発者は、電話回線やヘッドホン、スピーカといった特定のハードウェア向けに音声を最適化できるようになる。

この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。

ZDNet Japan 記事を毎朝メールでまとめ読み(登録無料)

Special PR

特集

CIO

セキュリティ

スペシャル

ホワイトペーパー

新着

ランキング

  1. クラウドコンピューティング

    AI導入に立ちはだかる「データ」「複雑さ」「コスト」「人材」の壁をどう乗り切ればいいのか?

  2. クラウドコンピューティング

    【IDC調査】2026年には75%のアプリがAIを実装!導入で遅れた企業はどう“逆転”すべきか?

  3. 運用管理

    経産省調査で明らかに:未だにレガシーシステムを抱える企業が8割!オープン化でよくある課題とは?

  4. 運用管理

    AWS東京リージョンの大規模障害に学ぶ、パブリッククラウド上のシステムの迅速な復旧方法

  5. windows-server

    【ユースケース】ソフトウェア開発にDell EMCインフラ+コンテナを使うメリット

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNet Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]