エーアイ、進化した新世代DNN音声合成エンジン「AITalk6」を発表。品質が向上し、自然で豊かな表現が可能に

株式会社エーアイ

From: PR TIMES

2023-10-17 02:40

株式会社エーアイ(本社:東京都文京区、代表取締役社長:廣飯 伸一、証券コード:4388、以下、エーアイ)は、音声合成品質の向上を目指し継続しておりました研究開発の成果として、新しい音声合成技術を活用したエンジン「AITalk(R)6」を発表いたします。
AITalk6ではAITalk5で搭載した「DNN音声合成方式」の検証や新たな学習を積み重ね、品質改善を行った結果、より自然性の向上した音声合成を実現しました。



[画像: (リンク ») ]

主な改善ポイント


1.音声生成法の変更(ボコーダーからニューラルボコーダーへ)
信号処理による音声生成法(ボコーダ)をニューラルネットワークによる音声生成法(ニューラルボコーダ)に変更する事により、より自然で肉声感のある音声を合成できるようになりました。

2.ニューラルネットワークの構造変更
AITalk5では、軽量で高速な処理を実現するため音声特徴量を生成するニューラルネットワークは簡素な構造を採用していました。
今回AITalk6で採用したニューラルネットワークは、韻律モデルと音響モデルを統合し、音素や時間フレームの情報を短期や長期で考慮する構造を採用することで、従来よりも自然な音声に近い音声特徴量を生成できるようになりました。

実際の変化につきましては、以下より音声をご確認下さい。
(リンク »)

AITalk6の製品展開について


 今後、以下の製品・サービスに順次展開してまいります。
 ・A.I.VOICE
 ・AITalkSDK
 ・AITalkServer
 ・AICloudサービス
 ・Editor製品

プレスリリース提供:PR TIMES (リンク »)
本プレスリリースは発表元企業よりご投稿いただいた情報を掲載しております。
お問い合わせにつきましては発表元企業までお願いいたします。

【企業の皆様へ】企業情報を掲載・登録するには?

御社の企業情報・プレスリリース・イベント情報・製品情報などを登録するには、企業情報センターサービスへのお申し込みをいただく必要がございます。詳しくは以下のページをご覧ください。

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]