IBM、非構造化データ分析ソフト新版--HadoopデータをSQL文で利用可能

田中好伸 (編集部)

2013-04-25 18:20

 日本IBMは4月24日、非構造化データを並列で処理するソフトウェアの新版「IBM InfoSphere BigInsights V2.1」とストリームコンピューティングソフトウェアの新版「IBM InfoSphere Streams V3.1」を発表した。5月中旬から販売する。

 InfoSphere BigInsightsの新版では、分散並列処理フレームワーク「Apache Hadoop」のデータベースにアクセスするための「BigSQL」機能を実装している。BigSQLは、SQLの標準に準拠したインターフェースに対応、従来からあるリレーショナルデータベース(RDB)の標準的なSQL言語で利用できる。新規にHadoop向けのプログラミング言語を学ぶ必要がない。

 BigSQLの活用で、SQL言語でHadoopにあるデータの活用、RDB向けに開発されたアプリケーションのSQLインターフェースをそのまま活用できる。従来のデータベース技術者のスキルをそのまま活かせる。

 同ソフトウェアでは、分散ファイル共有システム「GPFS-FPO(General Parallel File System-File Placement Optimizer)」も実装している。GPFS-FPOは、UNIXで実績があるという汎用的な分散ファイル共有システム「General Parallel File System(GPFS)」(IBMが開発)をHadoop向けに対応させた。

 Hadoop向けのファイルシステム「HDFS(Hadoop Distributed File System)」の代わりにGPFSを活用できる。複数ノードからのファイルアクセスを可能にすることで、単一障害点(Single Point of Failure:SPOF)を排除し、セキュリティを向上できると説明している。

 InfoSphere Streamsの新版では、処理ロジックの実行プロセスを最適化、ストリーム処理の性能を向上させた。連携をサポートするほかの分析ツールに、オープンソースの統計解析処理言語「R」のモデルによるスコアリングの仕組みも追加し、時系列解析のためのツールキットの拡充などで、幅広い分析ロジックを組み込んだデータ処理が容易に導入できるという。

 InfoSphere BigInsights V2.1は、Hadoopを活用したデータの統合分析基盤としてInfoSphere Streams V3.1を同梱して提供する。価格は114万7000円から。ストリームコンピューティングの機能だけを必要とする企業にはIBM InfoSphere Streams V3.1を単体で提供する。価格は445万2000円から。両ソフトは、稼働環境の特定単位のリソース(Resource Value Unit:RVU)に基づいて、開発向けの小規模システムから大規模システムへのスケールアウトまで、システム規模にあわせた価格体系となっている。

 評価開発環境として「IBM InfoSphere BigInsights Enterprise Edition Starter Kit」と「IBM InfoSphere Streams Developer Edition」も用意。価格は、前者が57万3200円(1ユーザーあたり20Tバイトまで)、後者が39万6300円となっている。

図 IBMのビッグデータアーキテクチャと新製品の位置付け
※クリックすると拡大画像が見られます

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]