マイクロソフトのAzure SQL DWが進化、「Azure Synapse Analytics」 - (page 2)

Andrew Brust (Special to ZDNET.com) 翻訳校正: 村上雅章 野崎裕子

2019-11-08 16:50

Apache Sparkの統合など

 Apache Sparkの統合は、オープンソースのビッグデータアナリティクスフレームワークの単なる「バンドリング」というレベル以上のものとなっているようだ。例えば、Synapseクラスターがプロビジョニングされた際、(Spark SQLテーブルを格納できるという)ADLSの能力もそれに伴って必要となる(Azure Data Factoryでも同様だ)。Spark SQLテーブルはSQL ServerベースのTransact SQL(T-SQL)言語から、CREATE EXTERNAL TABLEのような明示的なコマンドを事前に必要とすることなく、即座にクエリーを実行できる。これらのクエリーと連携するエンジンは、「Apache Parquet」形式で格納されているデータファイルとネイティブなかたちで統合できるということだ。

 こうした機能は、Amazon Web Services(AWS)が提供する、「Amazon Simple Storage Service」(Amazon S3)に格納されたデータに対するSQLクエリーを可能にする「Amazon Athena」サービスと接戦を繰り広げるものとなるだろう。さらにこういった能力に加えて、Azure Synapse studioはPythonScala、ネイティブなSpark SQLのコードブロックを開発/実行する環境のインターフェースをノートブック型のエクスペリエンスとして統合するようにもなっている。またSparkとの統合は、SynapseがSpark MLlibの利点を活用し、MLワークロードを取り扱えるということも意味している。

 「Spark ML」のほかにMicrosoftは「Azure Machine Learning」や「Power BI」「Azure Data Share」、(Microsoftの「Common Data Model」に基づく)Open Data Initiativeをサポートするアプリケーション/サービスの統合も検討しているが、具体的な情報はあまり出てきていない。こういった統合は時とともに具体化していくだろう。また、Synapseブランドは同日にローンチされたとはいえ、付随する新機能はプレビューという形式でのみ展開されているようだ。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]