春に開催されるMicrosoftのカンファレンス「Build」では、毎年多数のデータプラットフォーム関連の発表が行われる。その多くは「Azure」に関するものだ。2020年のBuildはバーチャルイベントとして開催されたが、相変わらずデータプラットフォーム関連の発表も大量に行われた。ただし今年は、機能そのものに関する新しい発表よりも、機能の組み合わせや完成までの進捗状況、統合に関する話題が多かったようだ。新型コロナウイルスの感染拡大によって、顧客の関心が単体の新機能よりもソリューションの容易な導入に向かっていることを考えれば、この傾向は時宜にかなっていたと言えるだろう。
さまざまなサービスをつなぐ「Azure Synapse Analytics」
「Azure Synapse Analytics」は、「Azure Analytics」スタックの統合の要だ。2019年11月の「Ignite」で発表されたSynapse Analyticsは、「Azure SQL Data Warehouse」の後継サービスにあたる。ただしSynapse Analyticsは、単にSQL Data Warehouseをリブランディングしただけのサービスではなく、データレイクとデータサイエンス関連の機能が追加されている。
これらの機能は、「Apache Spark」や「SQLオンデマンド」を統合したことで実現された。SQLオンデマンドは、Microsoftの独自言語「Transact-SQL」(T-SQL)のクエリーを、「Azure Data Lake Storage」(ADLS)のファイルに対して直接実行できるクエリーサービスだ。また、Synapse Analyticsに含まれているブラウザベースの開発環境「Synapse Studio」によって、「Azure Data Factory」と「Power BI」がSynapse Analyticsに取り込まれた。これらの機能はすべて、プロビジョニングされたインフラからアクセスすることも、サーバーレス技術でオンデマンドでアクセスすることもできる。
Igniteでこれらの新機能が発表された時点では、Synapse Analyticsはまだプライベートプレビューの段階だったが、Build 2020の発表では、パブリックプレビューが始まったことが明らかになった。
MicrosoftのHTAP、「Synapse Link」
Synapse関連の発表は、発表済みの機能がパブリックプレビューに入ったことだけではなかった。Microsoftは、ハイブリッド型トランザクション分析処理(HTAP)のクラウドネイティブな実装である「Azure Synapse Link」の発表も行った(こちらもプレビューが始まっている)。HTAPとは、既存のオペレーショナルデータに対して、データの変換や移動なしでアナリティクスを適用できる仕組みだ。
Azure Synapse Linkはまず「Cosmos DB」で使えるようになる。Microsoftは今後、Synapse Linkの対象を「Azure SQL」「Azure Database for PostgreSQL」「Azure Database for MySQL」にも広げる予定だという。
開発者が使いやすいCosmos DBに
Cosmos DBに関しても、いくつかの発表があった。例えば、自動スケーリング機能(以前は「オートパイロット」と呼ばれていた機能)やサーバーレスモードでの運用が発表されたが、これによってアクティブな利用に合った課金を行えるようになる。自動スケーリングは、プロビジョニングする要求ユニットを、顧客が宣言した最大値の10%から100%の間で、需要に応じて自動的に増減させる機能だ。一方、サーバーレス機能では、処理単位の課金が可能になる。