はじめに
今回からは、2024年に公開された論文「BigLake: BigQuery’s Evolution toward a Multi-Cloud Lakehouse」に基づいて、マルチクラウド対応に向けたBigQueryの機能拡張について紹介していきます。今回は、その中心となる「BigLakeアーキテクチャー」の全体像を紹介します。
BigLakeアーキテクチャーの全体像
第176回からの記事「Vortex: BigQueryのStorage APIを支えるStorageエンジン」では、BigQueryのStorage APIを解説しましたが、そこでは、図1の標準アーキテクチャーを前提とした説明を行いました。図の最下段にある「Distributed Storage」には、BigQueryの検索処理に最適化された「BigQuery Managed Storage Tables」としてデータが保存されており、外部システムは中段の「High-throughput Storage API」を通してデータの読み書きを行います。
この続きは以下をご覧ください
(リンク »)
お問い合わせにつきましては発表元企業までお願いいたします。