グーグル・クラウド・ジャパン(Google Cloud)は4月6日、データクラウドを構成する新たなサービス群を発表した。7日にはデジタルカンファレンス「Google Data Cloud Summit 2022」が開催予定となっている。
Google Cloudは、データレイクとデータウェアハウスを統合し、データの制限を取り払うデータレイクストレージエンジン「BigLake」のプレビュー版を発表した。ストレージ形式やシステムを意識することなくデータの分析が可能となり、またデータの複製や移動が不要なことからコスト削減と業務効率化が期待される。
BigLakeでは、Google Cloudが提供するAPIインターフェース、「Apache Parquet」などのオープンファイル形式、「Apache Spark」などのオープンソース分散処理エンジンによって細かなアクセス制御が可能という。
BigLakeの概要図
同社はまた、分散型のリレーショナルデータベースサービス「Cloud Spanner」に変更ストリームを追加した。これは、Spannerでのデータの追加、更新、削除を追跡し、データベース全体の変化をリアルタイムにストリーミングするもの。
「Vertex AI」は、人工知能(AI)モデルの構築デプロイ、拡張に必要なツールを備えたマネージド型の機械学習(ML)プラットフォーム。Vertex AIに関しては、「Vertex AI Workbench」の一般提供と「Vertex AI Model Registry」のプレビュー提供が発表された。
Vertex AI Workbenchは、AI/MLシステムを構築するための開発環境。データ分析、データサイエンス、機械学習に共通のツールセットを利用でき、「BigQuery」「Serverless Spark」「Dataproc」をネイティブ統合している。従来のNotebooksよりも5倍速く、MLモデルを構築、トレーニング、デプロイできるとしている。Vertex AI Model Registryは、MLモデルを検出、使用、管理するための中央リポジトリーを提供する。データサイエンティストがMLモデルを共有することで、アプリケーション開発者によるモデルの使用が容易になる。
「Google Data Studio」内でビジネスインテリジェンス(BI)ツール「Looker」のデータモデルにアクセスできるようになる、「Connected Sheets for Looker」も発表された。「Looker Explore」「Google スプレッドシート」など、より幅広い方法でデータへのアクセスが可能になる。
また、新たなパートナー認定制度として「Google Cloud Ready - BigQuery」を発表。機能要件と相互運用性要件のコアセットを満たすものを評価するプログラムで、既に25社以上のパートナーを認定している。新しいツールの評価に伴うユーザーのコストを削減するとともに、新しいユースケースへのサポートを追加しているという。
オンプレミスや他社クラウドからのデータベース移行を支援するプログラムも発表した。Deloitteなどのパートナーから提供されるツール、リソース、専門知識や、データベースの移行コストを相殺するためのインセンティブが含まれているという。