データブリックス・ジャパンは11月13日、これまでデータウェアハウス(DWH)を対象としていたワークロードをデータレイク上で実行できるようにする「SQL Analytics」の提供を開始すると発表した。
SQL Analyticsは、同社が提唱する次世代アーキテクチャー「Lakehouse(レイクハウス)」を実現するための構成要素の一つとなる。レイクハウスは「データレイク」と「データウェアハウス」を組み合わせた造語であり、DWHのパフォーマンスとデータレイクの経済性を「いいとこ取り」したものという。
データブリックス・ジャパン 社長の竹内賢佑氏(左)とソリューション・アーキテクトの竹下俊一郎氏
「従来のクラウド型DWHに比べて、最大9倍の価格とパフォーマンスを実現する」とデータブリックス・ジャパン 社長の竹内賢佑氏は強調する。SQL Analyticsは、11月18日にパブリックプレビューとして公開される予定。
従来、ビジネスインテリジェンス(BI)のワークロードにはDWH、データサイエンスや機械学習のワークロードには機械学習基盤、データ連携のワークロードにはデータレイクといった具合に、それぞれ構築、維持しなければならなかった。
従来のデータアーキテクチャー
レイクハウスで実現を目指すデータアーキテクチャー
また、複数のアーキテクチャーが共存することでデータのサイロ化が進み、データ活用の障害となったり、生産性の低下となったりしている。レイクハウスアーキテクチャーは、単一のアーキテクチャー上で全てのワークロードを実行することで、こうした問題を解消することを目指している。
SQL Analyticsは、オープンフォーマットのデータエンジン「Delta Lake」をベースに構築されている。自動スケーリングのエンドポイントを提供することで、ユーザーの負荷が高い場合でもクエリーの遅延を低く抑えることができ、クエリー実行エンジン「Delta Engine」によって大規模/小規模なデータセットの両方に対して迅速なクエリーの実行が可能になっている。
これにより、データレイクの従来の範囲がデータサイエンスや機械学習からBIやSQLを含む全てのデータワークロードにまで拡大され、組織はデータエンジニアリング、データサイエンス、データアナリティクスを横断する唯一の信頼できるデータソースを構築できるとしている。