IBMは6月に米サンフランシスコで開催された「Spark Summit」で、「Apache Spark」に対する3億ドルの資金投入、Spark Technology Centerの設立、および3500名の専任研究者の配属を発表することで、Apache Sparkへの全面的な支援を表明した。そして米国時間10月26日、IBMはラスベガスで開催中の自社イベント「IBM Insight 2015」で、「IBM Analytics on Apache Spark」を発表した。「Bluemix」クラウドの一部として提供する「Spark-as-a-Service」だという。
Apache SparkをBluemix環境で提供するIBMの目的は、「Cloudant NoSQL」や「dashDB」などを含む他のクラウドデータやアナリティクスサービスと、Apache Sparkを統合することだ。同社では、コードからデータベースを構築し、そのデータベースでビッグデータを構築し、そのビッグデータに対するアナリティクスを実現するうえで、アプリケーション開発用クラウドであるBluemixを使用することは理に適っていると判断したようだ。
- TechRepublic Japan関連記事
- ビッグデータの世界に立ち向かう--NoSQLという答え
- Uberの事例に学ぶ--NoSQLが最適解でない時
- リアルタイム分析の課題--データをどう組み合わせるべきか
一方、IBMは今回のイベントで「Insight Cloud Services」と名付けた新サービスも併せて発表した。これは、TwitterやThe Weather Companyなどの情報源から取得した人間、事象、地理空間、商取引などに関する外部データを利用可能にするサービスだ。つまりIBMは、そうした外部データで顧客のデータを補完し、その補完されたデータをApache Sparkで解析できる、完全なアナリティクスサービスの提供を目指している。
CloudantがIBMに買収される前に同社の最高経営責任者(CEO)を務め、現在はIBMのCloud Data Services(CDS)部門でゼネラルマネージャーを務めているDerek Schoettle氏は、以前にIBMのApache Sparkに対する強い思い入れについて語っていた。それによると、IBMはApache Sparkを単なるデータ並列処理プラットフォームではなく、機械学習、SQLアクセス、グラフエンジン処理、ストリーミングデータ解析などにも対応可能な、万能のデータ処理プラットフォームになり得ると考えていたという。IBMのApache Sparkに対する思い入れは非常に強く、それは自社のコマース製品とアナリティクス製品の多くをApache Sparkに移行したことにも現れていた。
データとアナリティクスの分野における潜在能力で、IBMに比肩し得る企業は恐らく業界に存在しない。なぜなら同社は、「DB2」「Watson」「Netezza」「Cognos」「TM1」「SPSS」「DataStage」「Informix」「Cloudant」「BigInsights」という製品と技術を保有しているからだ。もしIBMがこれら全製品のApache Sparkを中心としたクラウド展開に成功すれば、それはApache Sparkが現代のデータアナリティクスを駆動する能力と汎用性を備えていることの決定的な証明となるだろう。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。