Microsoftは、「Azure Data Lake Storage」サービスの第2世代(Gen2)バージョンをプレビューリリースした。
Microsoftは、この「Gen2」バージョンを「妥協のないデータレイク」と呼び、米国時間6月27日に新しいプレビュー版を発表した。興味がある読者は、こちらからプレビュー版にサインアップできる。
「Azure Data Lake」は、クラウドでビッグデータ分析を行うためのMicrosoftのレポジトリだ。
「Azure Data Lake Storage Gen2」は、第1世代のAzure Data Lakeの中核機能を、「Apache Hadoop」対応のファイルシステムのエンドポイントとともに一元化する。ファイルシステムのエンドポイントは、「Azure Blob Storage」に直接統合されている。
Microsoftは、公式ブログで次のように説明している。「今回の強化は、オブジェクトストレージの規模や費用便益を、通常はオンプレミスのファイルシステム特有のものと考えられている信頼性や性能と結びつけるものだ。この新しいファイルシステムには、ファイルやフォルダを第一級オブジェクトとする完全に階層化された名前空間を持つため、分析作業の実行の高速化と信頼性向上につながる」
Gen2は顧客に「無制限のストレージ」を提供し、「Azure Active Directory」をネイティブでサポートするという。
Microsoftは2015年に、Azure Data Lakeサービスに向けた最初の計画を発表した。第1世代のAzure Data Lakeは、Azure上でHadoopを動作させるWindowsおよびLinux向けのサービス「Azure HDInsight」と連携するよう設計された。ビッグデータのストレージや分析を目的として同社が社内で使用している「Cosmos」をベースにしていた。
Microsoftは27日、ハイブリッドデータ統合(ETL)サービス「Azure Data Factory」バージョン2の新機能をいくつか一般向けに提供することも発表した。新機能には、制御フローのデータパイプライン構造のサポートや、コーディング不要なデータ移動、オーケストレーションデザイン、柔軟なスケジューリングなどがある。
Microsoftは同じく27日、21Vianetとの提携を通じて中国で提供している現行の2カ所に加えて、2つの新たなAzureリージョンを提供することも発表した。追加される2カ所がどこか問い合わせたが、今のところ回答はない。
提供:Microsoft
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。