音声合成技術を有するNTTテクノクロスと、AIによる人物動画生成技術を有するデータグリッドの最先端技術を活用して講義動画を生成し、オンライン学習動画サービス「gacco®(ガッコ)」を運営するガッコが株式会社NTTドコモ(以下、ドコモ)と連携して講座の提供を行っています。
■最先端のAIによる人物動画生成と音声合成の技術を活用したMOOC講座
本講座は、NTTテクノクロスの音声合成サービス「FutureVoice® Crayon(フューチャーボイス クレヨン)」 (リンク ») を活用して、テキストデータから講座内の音声データを生成します。テキストデータを「FutureVoice® Crayon」にインプットすることで、人間の声と遜色ない自然な音声データが生成されます。
次に、データグリッドのAIによる人物動画生成技術により、音声データと数分程度の講師動画をもとに、音声に口の動きを合わせ、講師本人が話しているような長尺の講義動画を自動的に生成します。この技術は、少数のデータで精度の高いデータ生成が可能なGAN(Generative Adversarial Network / 敵対的生成ネットワーク)※3により実現しています。
■講座概要
【講座名】
AIの基礎と開発プロジェクトの進め方
【内容】
Week1:人工知能(AI)とは
人工知能(AI) / 機械学習
Week2:生成AIの応用事例とその仕組み
GANとは / GANの応用例 / GANの仕組み
Week3:AI開発プロジェクトの進め方
AI開発プロジェクトの流れ / 企画・要件定義フェーズ / データ準備フェーズ / PoC開発フェーズ
【学習期間】
3週間
【受講申込先】 受講方法・受講申込などは、以下のホームページをご覧ください。
(リンク »)
■講座内容
近年、人工知能(AI)は驚異的な技術進歩を遂げたことで様々な形で社会実装が進んでいます。その結果、テレビや新聞といったメディアを通して耳にしない日はないというほど私たちにとって身近な存在になりました。
本講座では、AIに関する基本的な解説からはじまり、実際にAI開発プロジェクトを進める際のポイントまで、初心者の方でも理解しやすい平易な言葉で解説していきます。
第1週では、AIの概要と最低限押さえておきたい専門用語の解説を通して、AIの基礎を学んでいただきます。
第2週では、AIの中でも比較的新しい領域である「生成AI」について、具体的な応用事例も交えながらその仕組みを解説していきます。そして、第3週では、AI開発プロジェクトを進める上でプロジェクトを成功に導くためのポイントを、フェーズごとにできるだけわかりやすくまとめました。
この講座を通して多くの方々がAIについての理解を深めるとともに、AI開発プロジェクトの進め方の基本を学ぶキッカケになることを願っています。
■講師紹介
岡田 侑貴
株式会社データグリッド 代表取締役社長CEO
京都大学にて機械学習分野を専攻し、京都のAIベンチャー企業にて金融分野のデータ解析業務に従事。その後、AIの研究領域において急速な発展を遂げていたGAN(Generative Adversarial Network、敵対的生成ネットワーク)に注目し、GANの技術開発及び社会実装を行うべく同社を設立。Intelligent Natureという同社ビジョンの実現に向け、様々な大手企業との共同プロジェクトを組成、プロジェクトの事業化に尽力している。
■取組の背景と今後について
これまで、講座の動画制作は、撮影用のスタジオを用意し、あらかじめ準備した講義原稿を講師が解説する模様を撮影することが基本でしたが、人物動画生成と音声合成の技術を活用することでスタジオに出向くことなく、かつ講師が資料説明する必要もなく、動画を制作することが可能となりました。
今後、Withコロナ・Afterコロナの時代において、大学や研究機関、企業や団体が求める動画制作の効率化を目的として、AI技術を活用した動画制作のプロダクト化に向け開発を進めていきます。
このプレスリリースの付帯情報
用語解説
※1 2021年3月12日現在、ガッコ調べ。
※2 MOOCとは:Massive Open Online Coursesの略称で、「大規模公開オンライン講座」と訳されます。Web上で誰でも無料で参加可能な大規模な講座を提供し、修了者に対して修了証を発行する教育サービスです。2012年より米国を中心として、主要大学および有名教授により公開され、2019年末現在で、世界中から1億1000万人以上が受講しています。
※3 GAN(Generative Adversarial Network / 敵対的生成ネットワーク)とは、機械学習における生成モデルの一つで、2つのネットワークが競い合うように学習することで、最終的に精度が高いデータを生成することが可能です。
お問い合わせにつきましては発表元企業までお願いいたします。