データドリブン経営が重要視される現在、多くの企業が部門横断型チームによるデータ活用に取り組んでいる。その結果、求められるボリュームやレイテンシー、耐障害性、データアクセス要件は常に厳しくなり、その要求に対応するために膨大な量のデータを保存・分析する最適な方法が模索されてきた。従来から、データ ウェアハウスやデータレイクなどのデータ アーキテクチャがこのような課題を解決するように使用されてきたものの、サイロ化されたアーキテクチャ手法では、データの移動・処理・重複が発生し、複雑な ETL パイプラインが必要だった。また、標準的なレイクハウス アーキテクチャでは、クロスクラウド分析、リアルタイム処理、 AI/ML の民主化の問題を解決することは難しいのが現状だ。
本資料では、そうした課題を解決する方法として、 Google Cloud が提供する「分析レイクハウス」を提案。アーキテクチャの各階層について触れるとともに、分析レイクハウスの概要や活用メリットを紹介する。また、データエンジニア、アナリスト、サイエンティストなどがそれぞれの技術的能力に合った方法で企業データを生産的かつ安全に利用できる分析レイクハウスの構築方法を詳細に解説する。
ホワイトペーパー