「Azure SQL Data Warehouse」(SQL DW)の第1世代は2015年に発表され、第2世代は2018年に一般提供が開始された。そして、フロリダ州オーランドで開催中のMicrosoftの開発者向けカンファレンス「Microsoft Ignite 2019」において、同社は実質的にSQL DWの第3世代となる「Azure Synapse Analytics」をプレビュー段階の新機能とともに発表した。ひと言で説明すると、Synapse Analyticsはデータウェアハウスやデータレイク、機械学習(ML)、これら構成要素をつなぎ合わせるデータパイプラインといった、一連のアナリティクスワークロードを統合するための製品だ。
筆者の得た詳細
MicrosoftのAzure Dataおよび人工知能(AI)製品担当ディレクターであるDaniel Yu氏とAzure SQL Data Warehouse担当主席プログラムマネージャーのCharles Feddersen氏は、米ZDNetを交えたブリーフィングで、Microsoftが今回発表した意欲的な統合アナリティクス製品の詳細を説明してくれた。SQL DWからSynapseへの転換に関して、同ブリーフィングで筆者が得た理解は次の3つに要約される。
- 中核となるデータウェアハウスエンジンがチューンアップされ、他社のクラウドデータウェアハウスプラットフォームと戦ううえで武器となる新機能が追加された。これには、明示的なプロビジョニングやオンデマンドの(サーバーレス)インフラによるワークロードへの対応能力が含まれており、それぞれの価格モデルに対応付けられている。
- 「Apache Spark」(「Azure Databricks」ではなく、オープンソースのものだ)と「Azure Data Lake Storage」(ADLS)が統合され、データレイクワークロードに対応できるようになっている。
- 統合ウェブユーザーインターフェース「Azure Synapse studio」により、Synapseのデータウェアハウスとデータレイクという双方の側面に対する統制とともに、「Azure Data Factory」によるデータ準備とデータ管理への対応能力が提供される。