Microsoftは米国時間2月7日、「Azure Data Lake Storage Gen2」(ADLS Gen 2)と「Azure Data Explorer」(ADX)の一般提供開始を発表した。これらの機能は、Azureが持つアナリティクス機能のパフォーマンスとセキュリティを強化するものだ。
同社は、ADLSは「Azure Blob Storage」の持つスケーラビリティ、費用対効果、セキュリティモデルやその他の豊富な機能と、アナリティクスで利用されることを前提として設計された、高パフォーマンスで「Hadoop Distributed File System」と互換性のあるファイルシステムを組み合わせたデータレイクだと説明している。ADLSのポイントは、同社が開発した「Azure Blob File System」ドライバによって、Apacheのエコシステムとの相互運用性が確保されていることだ。また、アナリティクスの処理速度を向上させるために、ファイルやフォルダに対する不可分操作が可能な階層型名前空間(HNS)が実装されている。
ADLSは「Power BI」やAzureのさまざまなサービスと緊密に統合されており、ClouderaやHortonworksを含む多くのビッグデータアナリティクスのシステムインテグレーターもADLSに対応しているという。
一方、ADXは大量のストリーミングデータをリアルタイム分析するための、高速なフルマネージドアナリティクスサービスだ。処理速度とシンプルさを売りにしており、データやメタデータの変更なしに、10億件のレコードに対するクエリを1秒以下で実行できる能力を持っている。
これらに加え、ハイブリッドクラウドベースのデータ統合サービスである「Azure Data Factory」(ADF)の新機能である、「Mapping Data Flow」がプレビューとして公開された。この機能を利用すれば、Sparkやインフラに対す深い知識がなくても、データ変換プロセスを視覚的にデザイン・構築・管理できるという。
現時点では、ADXは41カ所、ADFは21カ所のリージョンで利用できる。