データレイクとDWHの“いいとこ取り”--データブリックスが目指す「レイクハウス」

藤本和彦 (編集部)

2020-11-13 12:17

 データブリックス・ジャパンは11月13日、これまでデータウェアハウス(DWH)を対象としていたワークロードをデータレイク上で実行できるようにする「SQL Analytics」の提供を開始すると発表した。

 SQL Analyticsは、同社が提唱する次世代アーキテクチャー「Lakehouse(レイクハウス)」を実現するための構成要素の一つとなる。レイクハウスは「データレイク」と「データウェアハウス」を組み合わせた造語であり、DWHのパフォーマンスとデータレイクの経済性を「いいとこ取り」したものという。

データブリックス・ジャパン 社長の竹内賢佑氏(左)とソリューション・アーキテクトの竹下俊一郎氏
データブリックス・ジャパン 社長の竹内賢佑氏(左)とソリューション・アーキテクトの竹下俊一郎氏

 「従来のクラウド型DWHに比べて、最大9倍の価格とパフォーマンスを実現する」とデータブリックス・ジャパン 社長の竹内賢佑氏は強調する。SQL Analyticsは、11月18日にパブリックプレビューとして公開される予定。

 従来、ビジネスインテリジェンス(BI)のワークロードにはDWH、データサイエンスや機械学習のワークロードには機械学習基盤、データ連携のワークロードにはデータレイクといった具合に、それぞれ構築、維持しなければならなかった。

従来のデータアーキテクチャー
従来のデータアーキテクチャー
レイクハウスで実現を目指すデータアーキテクチャー
レイクハウスで実現を目指すデータアーキテクチャー

 また、複数のアーキテクチャーが共存することでデータのサイロ化が進み、データ活用の障害となったり、生産性の低下となったりしている。レイクハウスアーキテクチャーは、単一のアーキテクチャー上で全てのワークロードを実行することで、こうした問題を解消することを目指している。

 SQL Analyticsは、オープンフォーマットのデータエンジン「Delta Lake」をベースに構築されている。自動スケーリングのエンドポイントを提供することで、ユーザーの負荷が高い場合でもクエリーの遅延を低く抑えることができ、クエリー実行エンジン「Delta Engine」によって大規模/小規模なデータセットの両方に対して迅速なクエリーの実行が可能になっている。

 これにより、データレイクの従来の範囲がデータサイエンスや機械学習からBIやSQLを含む全てのデータワークロードにまで拡大され、組織はデータエンジニアリング、データサイエンス、データアナリティクスを横断する唯一の信頼できるデータソースを構築できるとしている。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

注目している大規模言語モデル(LLM)を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]