Microsoftは米国時間7月10日、「Apache Hadoop」をベースにした同社のクラウドサービス「Azure HDInsight」上で「Apache Spark」を稼働させる、「Spark for Azure HDInsight」のパブリックプレビュー版を公開した。Spark for Azure HDInsightは、Sparkのダッシュボードで採用されているユーザーインターフェースを統合している。また、「Jupyter」や「Apache Zeppelin」のノートブックに対するサポートを組み込むとともに、ブラウザ環境からPythonやScalaの(それぞれの)コードを作成できるほか、Sparkのデータを操作したり、検索したり、可視化するためのSQLのクエリを発行できるようにもしている。
Spark for Azure HDInsightによるノートブックのサポート
またMicrosoftは、同社の「Power BI」サービスとSpark for Azure HDInsightを直接統合し、7月24日から一般提供を開始すると同日付けで発表した。
新たに提供されるPower BIでは、ユーザーはその他のデータサービスやクラウドサービスと同様にSpark for Azure HDInsightを選択し、データセットを作成できるようになる。
Power BIのデータソースとしてSpark for Azure HDInsightを利用
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。