人工知能(AI)について知っていると思っていたことが、オープンソースAIによって全て変わりつつある。「DeepSeek」を見れば分かるだろう。この中国のオープンソースプログラムは、AI業界の経済に大きな衝撃を与えた。「Linux」で世界をリードするRed Hatは、オープンソースとAIの力を他よりもよく理解している。
オープンソースAIに対するRed Hatの現実的なアプローチは、同社の数十年にわたるオープンソースの原則への取り組みを反映しつつも、現代のAIシステム特有の複雑さを考慮したものだ。汎用(はんよう)人工知能(AGI)の夢を追いかけるのではなく、企業の実際のニーズと、現在のAIにできることのバランスを取っている。
一方で、Red Hatは「オープンソースAI」を取り巻くあいまいさも認めている。2024年11月に開催の「Linux Foundation Member Summit」において、Red Hatの主任商務顧問であるRichard Fontana氏は、従来のオープンソースソフトウェアがアクセス可能なソースコードに依存しているのに対し、AIには訓練データとモデルの重みが不透明という課題があることを強調した。
Fontana氏はパネルディスカッションで次のように語った。「AIで(ソースコードに)相当するものは何だろうか。明確な答えはない。訓練データはオープンでなければならないという意見もあるが、これはLLM(大規模言語モデル)では極めて非現実的だ。したがって、オープンソースAIとは、現段階では達成不可能な目標なのかもしれない」
このジレンマが顕著に現れているのは、制限があるにもかかわらず「オープンソース」と銘打ったライセンスでリリースされたモデルだ。こうした偽のオープンソースプログラムには、Metaの「Llama」などがある。Fontana氏はこのトレンドを批判し、多くのライセンスがオープン性を主張しながらも、さまざまな分野やグループを差別していると指摘した。
主な課題は、競争や法律の現実と透明性の折り合いをつけることだ。Red Hatはオープン性を支持しているが、Fontana氏は訓練データの完全な開示を求める厳格な定義に対して警鐘を鳴らす。訴訟の多い現在の環境で詳細な訓練データを開示すると、モデルを作成した人が標的にされるリスクがあるからだ。公開データのフェアユース(公正な使用)によって、透明性の問題が複雑になっている。
Red Hatの最高技術責任者(CTO)であるChris Wright氏は、再現性を追求する現実的なステップを強調し、LLM「Granite」などのオープンモデルや、コミュニティー主導の微調整を可能にする「InstructLab」などのツールを支持している。同氏は「InstructLabにより、誰もがスキルでモデルに貢献でき、AIで真のコラボレーションが実現する。オープンソースはそのようにしてソフトウェア分野で成功した。今度はAIの番だ」と記している。
Wright氏はこれを、Red HatがLinuxで培ったレガシーの進化だと捉えている。「LinuxがITインフラストラクチャーを標準化したように、『Red Hat Enterprise Linux AI』(RHEL AI)がエンタープライズAIの基盤を築き、オープン性、柔軟性、ハイブリッド性を設計段階で組み込む」
Red Hatが構想するAI開発は、オープンソースソフトウェアのコラボレーションの精神を反映するものだ。Wright氏は「モデルはオープンソースの成果物でなければならない。知識の共有はRed Hatの使命だ。こうすることで、ベンダーロックインを回避し、誰もがAIの恩恵を受けられるようにする」と主張している。