Clouderaは、Amazon Web Services(AWS)とSnowflakeを創設メンバーとする「相互運用エコシステム」を発表した。
企業は現在、信頼できる唯一の情報源(SSOT)を実現するために、ClouderaやSnowflakeのツールを組み合わせて、データの取り込み、処理、消費の基盤を整えている。今回の協業により、ClouderaとSnowflake、AWSのサービス(S3、EKS、RDS、EC2、EMR、Athenaなど)とのデータ共有と相互運用性が強化される。
Clouderaによると、同社顧客はSnowflakeのコンピューティングエンジンとClouderaのレイクハウスを利用して、コストを抑えながら分析とAIのワークロードを効率的に拡大したいと考えているという。また、AWSサービスやハイブリッド/マルチクラウド環境全体で、データサイロがない統一されたワークフローの実現を期待している。さらに、強力なガバナンスとリアルタイム分析を組み合わせて、効率的で安全なデータ管理とAIによる洞察を求めている。
今回の協業により、AWS上でClouderaのデータレイク機能とSnowflakeのデータクラウドを併用できるようになり、プラットフォーム全体で統一されたデータアクセスと共有が実現する。また、AWS上で稼働するClouderaのオンプレミス/ハイブリッドのデータセットが、Snowflakeの分析機能と統合される。
これにより、特定の分析にはSnowflakeを使いながら、全体のデータ管理はClouderaで行うことで、AWSへのインフラ投資を最大限に活用できる。また、AWSに保存されたデータを簡単にSnowflakeに移せるため、マルチクラウド戦略をサポートし、特定のベンダーに依存せずにデータを移動させることができる。
Clouderaのセキュリティとガバナンス機能は、Snowflakeと共有するデータにも適用されるため、データの安全性と拡張性を保証する。
例えば、AWSでClouderaを使っているユーザーは、インフラ間でデータを移動させることなく、Snowflakeを使ってさらに詳しい分析ができる。また、Clouderaのデータ処理機能とSnowflakeの分析機能を組み合わせることで、効率的なAI/MLパイプラインを作ることも可能だとしている。
システム連係の概要図(提供:Cloudera)