ビッグデータ処理技術「Apache Hadoop」の商用ベンダーとして創業したClouderaは、来るべきAI時代に向けて技術基盤と事業戦略を打ち出している。「ハイブリッド」をキーワードに、オンプレミス資産のサポートを強みに、クラウド型データプラットフォームに対抗する。
10月に米国・ニューヨークで開催された年次カンファレンス「EVOLVE24 New York」で、最高経営責任者(CEO)のCharles Sansbury氏と最高戦略責任者(CSO)のAbhas Ricky氏に話を聞いた。
--CEOに就任して1年が経過しますが、Clouderaの可能性や機会をどのように見ていますか?
Sansbury氏:Clouderaに入社して約1年が経ち、市場の機会に対する期待は大きかった。Clouderaはグローバルなインフラを持ち、主要な顧客が世界中に存在し、これらの顧客にエンタープライズ向けのデータと分析のプラットフォームを提供できることを楽しみにしていた。世界のトップ10銀行のうち9行、保険業界のトップ10社のうち8社、自動車業界のトップ10社のうち7社がClouderaの顧客だ。
この1年で特に変わったのは、変化の速度だ。特にAIに関連する動きが加速し、顧客の関心が高まっている。就任当初はクラウドの重要性が強調されていたが、クラウドは大企業向けデータインフラの一部に過ぎない。クラウドは重要で必要だが、大規模なグローバル組織のデータインフラはクラウドだけでは構築できない。
Clouderaはオンプレミス、プライベートクラウド、パブリッククラウドの全てでワークロードの管理や移行を実現している。これができるのはClouderaだけであり、AI時代においてさらに求められている。顧客は取引するベンダーの数を減らしたいと考えており、Clouderaは1社でそのニーズに応えることができる。
--Clouderaはビッグデータ企業としてスタートしました。AIの時代の優位性はどこにあるのでしょうか?
Sansbury氏:Clouderaはビッグデータ処理技術でビジネスの基礎を築いた後、2022年に非公開企業になった。それ以来、10億ドル近くを投資して「Cloudera Data Platform(CDP)」などのエンジニアリング作業を進め、市場での地位を強化してきた。
現在、Clouderaは25エクサバイトのデータを管理しており、これは他のどのデータプラットフォームよりも多い。この膨大なデータ量は、Clouderaのビッグデータとアナリティクスの専門知識によって支えられている。Clouderaはデータを安全かつコスト効率良く保存し、アナリティクスに活用できるプラットフォームを提供しており、これはAI時代においてますます重要になっている。
Ricky氏:私からは、2つの強みを付け加えたい。まず、当初はApache Hadoopを使用していたが、オブジェクトストアを「Apache Ozone」に移行し、現在のCDPはOzoneを基盤としていることだ。これにより、スケーラビリティーなどの利点が得られ、アナリティクスやAIの要件を満たしている。
2つ目はハイブリッドアプローチだ。オンプレミスでもクラウドでもデータを管理できる。他のデータプラットフォームはクラウドを基盤としているが、われわれはエンドポイントアーキテクチャーとしてハイブリッドを重視している。これにより、顧客は柔軟性を享受でき、オンプレミスやプライベートクラウドでモデルを実行することで、データの管理性、観測性、セキュリティを確保できる。
--AIモデルをデータに近づけるアプローチを提唱しています。そのようなシステムにおけるClouderaの役割は?
Sansbury氏:Clouderaは「Apache Iceberg」を基盤としたオープンなデータレイクハウスを提供している。これにより、異なるデータサイロから共通のフレームワークとフォーマットでデータを取り込むことができる。顧客は大規模言語モデル(LLM)をデータに適用してパフォーマンスを評価し、運用環境で利用するためのツールや機能を利用できる。
このプラットフォームを使えば、企業のデータサイエンティストは社内データやオープンソース、プロプライエタリーのモデルを試し、用途やニーズに応じて活用できる。
このように、Clouderaのデータプラットフォームは複数のモデルをテストし、本番環境で使用することを可能にしている。
Cloudera Data Platform(CDP)の概念図