独SAPは現地時間3月15日、「Hadoop」向けの新しいインメモリクエリエンジン「SAP HANA Vora」の一般提供を開始した。
HANA Voraは「SAP HANA」ではなく「Apache Spark」をベースにしているが、SAP HANAとの統合も容易になっている。この製品は対話的なクエリやデータの分析を可能にするものだが、「Spark SQL」の単なるフロントエンドというわけではない。
- TechRepublic Japan関連記事
- ビッグデータの世界に立ち向かう--NoSQLという答え
- Uberの事例に学ぶ--NoSQLが最適解でない時
- リアルタイム分析の課題--データをどう組み合わせるべきか
この製品の名称は「Voracious」(食欲旺盛な)という単語に由来しており、データに対する旺盛な意欲を表している。その一例を挙げると、HANA VoraはSparkのデータソースAPIを拡張し、大元のデータソースエンジン自体にクエリ処理を委譲するための「プッシュダウン操作」をサポートするようになっている。
また、HANA Voraの一般提供版では「Amazon Simple Storage Service(S3)」のファイルストレージやBLOBストレージへの接続をサポートするとともに、ベータ段階のOLAP(オンライン分析処理)モデラーも搭載している。このモデラーによってドリルダウン分析をサポートする階層定義が可能になるため、同社は階層データに対するクエリをサポートするよう、Spark SQLを拡張してもいる。
HANA Voraは、Sparkベースのアナリティクスソリューションとして、特にHANAや同社のERPソフトウェア、「SAP Business Warehouse(BW)」からのデータの分析で力を発揮しそうだ。またこの製品は、Sparkをより強力かつより高速にしてメインストリームに押し上げる力となるはずだ。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。