スパコン「富岳」で大規模言語モデルの分散並列学習手法を研究開発

ZDNET Japan Staff

2023-05-22 15:15

 東京工業大学、東北大学、富士通、理化学研究所は5月22日、スーパーコンピューター「富岳」の政策対応枠を活用して、大規模言語モデル(LLM)の分散並列学習手法の研究開発を開始すると発表した。実施期間は2023年5月24日から2024年3月31日まで。

 LLMは対話型AI「ChatGPT」をはじめとする生成AIの中核として使用されている深層学習のAIモデル。発表では、「インターネットやスマートフォンのように社会全体の在り方を変える革新的な技術」とし、政府が目指す「Society5.0」の研究開発、経済社会、安全保障などを支える基盤技術として期待されているという。その一方で、基盤モデルの性能を高めるためには大量データを効率的に処理する高性能計算資源が不可欠となっている。

 今回開発する大規模言語モデル分散並列学習手法は、富岳の超大規模な並列計算環境においてLLMの学習を効率良く実行する技術となる。各機関・企業の役割は次の通り。

  • 東京工業大学:全体総括、大規模言語モデルの並列化と高速化
  • 東北大学:学習用データの収集、モデルの選択
  • 富士通:大規模言語モデルの高速化
  • 理化学研究所:大規模言語モデルの分散並列化・通信高速化、大規模言語モデルの高速化

 今後は、日本の研究者やエンジニアがLLMの開発に活用できるように、今回の研究成果を2024年度に「GitHub」や「Hugging Face」で公開する予定。多くの研究者や技術者が基盤モデルの改善や新たな応用研究に参画することで、効率的な方法が創出され、次世代の革新的な研究やビジネスの成果につながることを期待している。

 また、ものづくりをはじめとする産業分野などへの応用を想定したマルチモーダル化のためのデータ生成手法と学習手法を開発する名古屋大学や、LLM構築のためのデータと技術を提供するサイバーエージェントとの連携も検討していくとしている。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    「デジタル・フォレンジック」から始まるセキュリティ災禍論--活用したいIT業界の防災マニュアル

  2. 運用管理

    「無線LANがつながらない」という問い合わせにAIで対応、トラブル解決の切り札とは

  3. 運用管理

    Oracle DatabaseのAzure移行時におけるポイント、移行前に確認しておきたい障害対策

  4. 運用管理

    Google Chrome ブラウザ がセキュリティを強化、ゼロトラスト移行で高まるブラウザの重要性

  5. ビジネスアプリケーション

    技術進化でさらに発展するデータサイエンス/アナリティクス、最新の6大トレンドを解説

ZDNET Japan クイックポール

注目している大規模言語モデル(LLM)を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]