はじめに
前回に続いて、2024年に公開された論文「BigLake: BigQuery’s Evolution toward a Multi-Cloud Lakehouse 」に基づいて、マルチクラウド対応に向けたBigQueryの機能拡張について解説します。今回は、オブジェクトストレージにデータを保存するBigLake Tablesのアーキテクチャーを紹介します。
BigLake Tablesのアーキテクチャー
前回の記事の図2に示したように、BigQueryは、データの保存場所として、BigQuery標準のストレージ(BigQuery Storage)に加えて、Google Cloud Storageや他のクラウド上のオブジェクトストレージを用いることができます。これらのオブジェクトストレージにデータを保存する際に使用するのがBigLake Tablesです。そして、第176回からの記事「Vortex: BigQueryのStorage APIを支えるStorageエンジン」で解説したように、BigQueryに対するデータの読み書きは、BigQueryが提供するStorage APIを介して行われます。この点は、BigLake Tablesについても変わりありません。BigQueryを利用するユーザー、および、外部アプケーションに対して、BigQuery標準のManaged Tablesと同等の機能が提供されます。
BigQueryのテーブルは、カラムレベル、行レベルでのアクセス制御が行われますが、この点も変わりありません。
この続きは以下をご覧ください
(リンク »)
お問い合わせにつきましては発表元企業までお願いいたします。