NVIDIA AI Foundry が世界中の企業向けにカスタム Llama 3.1 生成 AI モデルを構築

NVIDIA

From: PR TIMES

2024-07-25 10:46



[画像: (リンク ») ]


・ 企業や国家は、NVIDIA AI Foundry で、Llama 3.1 405B および NVIDIA Nemotron モデルと組み合わせた独自のデータを使用して「スーパーモデル」を構築可能になりました。
・ NVIDIA AI Foundry は、キュレーション、合成データ生成、ファインチューニング、検索、ガードレール、評価にわたる包括的な生成 AI モデル サービスを提供しており、カスタム Llama 3.1 NVIDIA NIM マイクロサービスを展開し、新しい NVIDIA NeMo Retriever マイクロサービスを使用して正確な応答を実現します。
・ Accenture は新しいサービスを使用してクライアント向けにカスタム Llama 3.1 モデルを構築する最初の企業であり、Aramco、AT&T、Uber、その他の業界リーダーが新しい Llama NVIDIA NIM マイクロサービスへ初めてアクセスしています。

カリフォルニア州サンタクララ - 2024 年 7 月 23 日 - NVIDIA は本日、同日発表されたオープン利用可能なモデルの Llama 3.1 ( (リンク ») )コレクションにより、世界中の企業向けに生成 AI を強化する新しい NVIDIA AI Foundry ( (リンク ») )サービスと NVIDIA NIM(TM) ( (リンク ») )推論マイクロサービスを発表しました。

NVIDIA AI Foundry により、企業や国家は、Llama 3.1 と NVIDIA のソフトウェア、コンピューティング、専門知識を使用して、ドメイン固有の業界ユースケース向けのカスタム「スーパーモデル」を作成できるようになりました。企業は、独自のデータだけでなく、Llama 3.1 405B や NVIDIA Nemotron(TM)( (リンク ») ) Reward モデルから生成された合成データ( (リンク ») )を使用して、これらのスーパーモデルをトレーニングすることができます。

NVIDIA AI Foundry は、世界をリードするパブリック クラウドと共同で開発された NVIDIA DGX(TM) Cloud AI プラットフォームを活用しており、AI の需要の変化に応じて簡単に拡張できる重要なコンピューティング リソースを企業に提供します。

この新たなサービスの提供は、企業やソブリン AI 戦略を策定している国家が、独自のビジネスや文化を反映する生成 AI アプリケーション向けに、ドメイン固有の知識を備えたカスタムの大規模言語モデルを構築するニーズに応えます。

NVIDIA の創業者/CEO であるジェンスン フアン (Jensen Huang) は次のように述べています。「Meta のオープンに利用可能な Llama 3.1 モデルは、世界中の企業における生成 AI の導入にとって極めて重要な瞬間となります。Llama 3.1 は、あらゆる企業や業界が最先端の生成 AI アプリケーションを構築するための扉を開きます。NVIDIA AI Foundry は Llama 3.1 を全面的に統合しており、企業がカスタム Llama スーパーモデルを構築し、展開するのを支援する準備ができています」

Meta の創業者/CEO である Mark Zuckerberg 氏は次のように述べています。「新しい Llama 3.1 モデルは、オープン ソース AI にとって非常に重要なステップです。NVIDIA AI Foundry を使用すると、企業は人々が望む最先端の AI サービスを簡単に作成およびカスタマイズし、NVIDIA NIM で展開することができます。これを皆さんの手に届けられることを嬉しく思います」

プロダクション AI 向けの Llama 3.1 モデルの企業展開を強化するために、Llama 3.1 モデル用の NVIDIA NIM ( (リンク ») )推論マイクロサービスが ai.nvidia.com ( (リンク ») )からダウンロードできるようになりました。NIM マイクロサービスは、本番環境に Llama 3.1 モデルを展開する最も速い方法であり、NIM なしで推論を実行する場合よりも最大 2.5 倍のスループットを実現します。

企業は、Llama 3.1 NIM マイクロサービスを新しい NVIDIA NeMo Retriever NIM マイクロサービス( (リンク ») )と組み合わせて、AI コパイロット、アシスタント、デジタル ヒューマン アバター( (リンク ») )向けの最先端の検索パイプラインを作成できます。

Accenture が AI Foundry で企業向けカスタム Llama スーパーモデルを開発
世界的なプロフェッショナル サービス企業である Accenture( (リンク ») )は、自社だけでなく、文化、言語、業界を反映した生成 AI アプリケーションの展開を目指す顧客向けに、NVIDIA AI Foundry を初めて採用し、Accenture AI Refinery(TM) フレームワークを使用してカスタム Llama 3.1 モデルを構築しました。

Accenture の会長兼最高経営責任者 (CEO) である Julie Sweet 氏は次のように述べています。「世界の一流企業は、生成 AI があらゆる業界を変革していることを理解しており、カスタム モデルで動作するアプリケーションの展開を熱望しています。Accenture は、社内 AI アプリケーション向けに NVIDIA NIM 推論マイクロサービスと連携してきましたが、NVIDIA AI Foundry を使用することで、顧客がカスタム Llama 3.1 モデルを迅速に作成して展開し、各自のビジネス優先事項に合わせて革新的な AI アプリケーションを強化できるよう支援することができます」

NVIDIA AI Foundry は、カスタム スーパーモデルを迅速に構築するためのエンドツーエンドのサービスを提供します。NVIDIA AI Foundry は、NVIDIA のソフトウェア、インフラ、専門知識を、NVIDIA AI エコシステムのオープン コミュニティ モデル、テクノロジおよびサポートを組み合わせたものです。

NVIDIA AI Foundry を使用すると、企業は Llama 3.1 モデルと NVIDIA NeMo ( (リンク ») )プラットフォームを使用してカスタム モデルを作成できます。これには、Hugging Face RewardBench ( (リンク ») )で 1 位にランクされた NVIDIA Nemotron-4 340B Reward モデル ( (リンク ») )が含まれます。

カスタム モデルが作成されると、企業は NVIDIA NIM 推論マイクロサービスを作成し、好みのクラウド プラットフォームとグローバル サーバー メーカーの NVIDIA-Certified Systems(TM)( (リンク ») )で好みの MLOps および AIOps プラットフォームを使用して本番環境で実行することができます。

NVIDIA AI Enterprise の専門家とグローバル システム インテグレーター パートナーは、AI Foundry の顧客と協力して、開発から展開まで、プロセス全体を加速します。

NVIDIA Nemotron が高度なモデル カスタマイズを強化
ドメイン固有のモデルを作成するために追加のトレーニング データが必要な企業は、Llama 3.1 405B と Nemotron-4 340B を併用して合成データを生成( (リンク ») )し、カスタム Llama スーパーモデルを作成するときにモデルの精度を高めることができます。

独自のトレーニング データを持つ顧客は、ドメイン適応型事前トレーニング (DAPT) 用にNVIDIA NeMoを使用して Llama 3.1 モデルをカスタマイズし、モデルの精度をさらに高めることができます。

NVIDIA と Meta は、Llama 3.1 の蒸留レシピの提供でも協力しており、開発者はこれを使用して、生成 AI アプリケーション用のより小規模なカスタム Llama 3.1 モデルを構築できます。これにより、企業は AI ワークステーションやノート PC などのより広範なアクセラレーテッド インフラで Llama 搭載の AI アプリケーションを実行可能になります。

業界をリードする企業が NVIDIA と Llama で AI を強化
ヘルスケア、エネルギー、金融サービス、小売、運輸、通信の分野の企業は、すでに Llama 向けの NVIDIA NIM マイクロサービスに取り組んでいます。Llama 3.1 向けの新しい NIM マイクロサービスに最初にアクセスした企業の中には、Aramco、AT&T、および Uber があります。

16,000 基を超える NVIDIA H100 ( (リンク ») )Tensor コア GPU でトレーニングされ、データセンター、クラウド、および NVIDIA RTX(TM) ( (リンク ») )GPU を搭載したワークステーションや GeForce RTX ( (リンク ») )GPU を搭載した PC 上のローカルで NVIDIA アクセラレーテッド コンピューティングとソフトウェア向けに最適化された( (リンク ») ) Llama 3.1 多言語 LLM コレクションは、8B、70B、および 405B のパラメータ サイズの生成 AI モデルのコレクションです。

新しい NeMo Retriever RAG マイクロサービスが精度とパフォーマンスを向上
組織は、RAG( (リンク ») ) (検索拡張生成) 用の新しい NVIDIA NeMo Retriever NIM 推論マイクロサービスを使用することで、カスタマイズされた Llama スーパーモデルと Llama NIM マイクロサービスを本番環境に展開する際の応答精度を高めることが可能になります。

Llama 3.1 405B 向け NVIDIA NIM 推論マイクロサービスと組み合わせることで、NeMo Retriever NIM マイクロサービスは、RAG パイプラインで最高のオープンおよび商用テキスト Q&A 検索精度を実現します。

Llama 3.1 および NeMo Retriever NIM の展開をサポートするエンタープライズ エコシステム
エンタープライズ、データ、インフラのプラットフォームを提供する何百もの NVIDIA NIM パートナーは、新しいマイクロサービスを AI ソリューションに統合して、500 万人を超える開発者と 19,000社のスタートアップからなる NVIDIA コミュニティ向けに生成 AI を強化できるようになりました。

Llama 3.1 NIM および NeMo Retriever NIM マイクロサービスのプロダクション サポートは、NVIDIA AI Enterprise ( (リンク ») )を通じて利用できます。NVIDIA Developer Program ( (リンク ») )のメンバーは、まもなく NIM マイクロサービスに無料でアクセスして、好みのインフラ上で研究、開発、テストを行うことができます。

※本発表資料は米国時間 2024年 7 月 24 日に発表されたプレスリリース( (リンク ») )の抄訳です。

NVIDIAについて
1993年の創業以来、NVIDIA( (リンク ») ) (NASDAQ: NVDA) はアクセラレーテッド コンピューティングのパイオニアです。同社が 1999 年に発明した GPU は、PC ゲーム市場の成長を促進し、コンピューター グラフィックスを再定義して、現代の AI の時代に火をつけながら、各種産業のデジタル化を後押ししています。NVIDIA は現在、業界を再形成しているデータセンター規模の製品を提供するフルスタック コンピューティング企業です。詳細は、こちらのリンクから: (リンク »)

プレスリリース提供:PR TIMES (リンク »)
本プレスリリースは発表元企業よりご投稿いただいた情報を掲載しております。
お問い合わせにつきましては発表元企業までお願いいたします。

【企業の皆様へ】企業情報を掲載・登録するには?

御社の企業情報・プレスリリース・イベント情報・製品情報などを登録するには、企業情報センターサービスへのお申し込みをいただく必要がございます。詳しくは以下のページをご覧ください。

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]