SambaNova Systemsは2月28日、エンタープライズ向け生成AIモデル「Samba-1」を発表した。Samba-1は、50種類以上の最高品質のオープンソース生成AIモデルで構成され、規制対象企業向けとしては初の1兆パラメーターモデルと同社は述べる。
SambaNova Systemsの大規模言語モデル(LLM)プラットフォーム「SambaNova Suite」内で利用できる。2023年発表された同社AI半導体「SN40L」と統合され、ファインチューニングとプライベート環境での展開が10分の1規模のハードウェアで可能な、完全に最適化された1兆パラメーターモデルを提供する。これはSambaNovaのフルスタックプラットフォームの真の価値を示すものと同社は強調する。
「Samba-1はGPT-4に匹敵するが、オンプレミス、プライベートクラウドで提供できるため、ユーザーはプライベートデータをパブリックドメインにさらすことがないなくモデルをファインチューニングすることができ、エンタープライズ利用に適している」と同社の共同創業者であり最高経営責任者(CEO)を務めるRodrigo Liang氏はコメントする。
Samba-1のモデルは、さまざまなユースケース、タスク、言語でトレーニングされており、全てが単一の「エキスパート・コンポジション(Composition of Experts:CoE)」として連携する。これらのエキスパートは、「Llama 2 7B/13B/70B」「Mistral 7B」「DeepSeek Coder 1.3B/6.7B/33B」「Falcon 40B」「DePlot」「CLIP」「Llava」といったモデルに基づいている。
Samba-1は、次のような特徴を備える。
- エンタープライズ対応:高レベルの精度と企業向けのコントロールを提供する、プライベートで安全な1兆パラメーターモデル。
- 高いパフォーマンスと精度:CoEアーキテクチャーは、複数のスペシャリストモデルを集約し、パフォーマンスと精度を向上させながら、ファインチューニングをモジュール化する。
- 低コストで管理が簡単:Samba-1は単一のエンドポイントとして展開され、管理が簡素化されるため、低コストで利用できる。
- 10分の1のコストで推論:推論コストは、大規模なモノリシックモデルよりも10分の1以下にできる。
- データへのアクセスを制御:データへのアクセスを制御するのと同じ方法で、エキスパートモデルへのアクセスを制御する。
- モデルの所有権:ユーザーはモデルを所有し、ユーザーの環境内で独自のデータを使用してファインチューニングできる。このモデルはオープンスタンダードを使用して構築されているので、ベンダーロックインはない。
- 迅速かつ簡単な導入:フルスタックの生成AIプラットフォームの一部として、柔軟な導入が可能。
Samba-1は、AccentureやNetAppといった顧客やパートナーで活用されている。