日本IBMは4月24日、非構造化データを並列で処理するソフトウェアの新版「IBM InfoSphere BigInsights V2.1」とストリームコンピューティングソフトウェアの新版「IBM InfoSphere Streams V3.1」を発表した。5月中旬から販売する。
InfoSphere BigInsightsの新版では、分散並列処理フレームワーク「Apache Hadoop」のデータベースにアクセスするための「BigSQL」機能を実装している。BigSQLは、SQLの標準に準拠したインターフェースに対応、従来からあるリレーショナルデータベース(RDB)の標準的なSQL言語で利用できる。新規にHadoop向けのプログラミング言語を学ぶ必要がない。
BigSQLの活用で、SQL言語でHadoopにあるデータの活用、RDB向けに開発されたアプリケーションのSQLインターフェースをそのまま活用できる。従来のデータベース技術者のスキルをそのまま活かせる。
同ソフトウェアでは、分散ファイル共有システム「GPFS-FPO(General Parallel File System-File Placement Optimizer)」も実装している。GPFS-FPOは、UNIXで実績があるという汎用的な分散ファイル共有システム「General Parallel File System(GPFS)」(IBMが開発)をHadoop向けに対応させた。
Hadoop向けのファイルシステム「HDFS(Hadoop Distributed File System)」の代わりにGPFSを活用できる。複数ノードからのファイルアクセスを可能にすることで、単一障害点(Single Point of Failure:SPOF)を排除し、セキュリティを向上できると説明している。
InfoSphere Streamsの新版では、処理ロジックの実行プロセスを最適化、ストリーム処理の性能を向上させた。連携をサポートするほかの分析ツールに、オープンソースの統計解析処理言語「R」のモデルによるスコアリングの仕組みも追加し、時系列解析のためのツールキットの拡充などで、幅広い分析ロジックを組み込んだデータ処理が容易に導入できるという。
InfoSphere BigInsights V2.1は、Hadoopを活用したデータの統合分析基盤としてInfoSphere Streams V3.1を同梱して提供する。価格は114万7000円から。ストリームコンピューティングの機能だけを必要とする企業にはIBM InfoSphere Streams V3.1を単体で提供する。価格は445万2000円から。両ソフトは、稼働環境の特定単位のリソース(Resource Value Unit:RVU)に基づいて、開発向けの小規模システムから大規模システムへのスケールアウトまで、システム規模にあわせた価格体系となっている。
評価開発環境として「IBM InfoSphere BigInsights Enterprise Edition Starter Kit」と「IBM InfoSphere Streams Developer Edition」も用意。価格は、前者が57万3200円(1ユーザーあたり20Tバイトまで)、後者が39万6300円となっている。
※クリックすると拡大画像が見られます