日本IBMは10月15日、ビッグデータ分析に特化した統合基盤を追加したと発表した。ソフトウェア事業担当の専務取締役執行役員のVivek Mahajan氏はIBMのビッグデータ戦略について、検索、分析、Hadoopによるシステム構築、データ品質保持など「複数の技術を機能を組み合わせたプラットフォーム化が必要と考えている」と指摘。具体的な施策が、ハードウェアとソフトウェアを組み合わせた垂直統合型システムの拡充だ。
日本IBMのソフトウェア事業担当の専務取締役執行役員のVivek Mahajan氏
追加したのは垂直統合型システム「PureData System」の2製品。それぞれ、非構造化データを含む大量データを処理するHadoop向けの新製品「PureData System for Hadoop H1001」と、今年2月に発表した旧Netezza系の分析システムのエントリモデルという位置づけとなる「IBM PureData System for Analytics N2002-002」だ。
Hadoopに特化したアプライアンス
H1001の特徴は、サイジング、ソフトウェア、ハードウェアなどを含めすべて工場で設定して提供する点にある。特に、IBMがオープンソースのHadoopをより使いやすくするために提供する基盤ソフトウェア「InfoSphere BigInsights」を組み込んでいる点が注目だという。
BigInsightsには、JDBCやODBCを使ってSQLをHadoop上で扱えるようにするANSI準拠の「BigSQL」、Hadoop用の表計算ツール「BigSheets」、CPUやネットワークの使用率などハードウェアを含めて監視できるアプライアンスならではの管理コンソールなど、Hadoopを運用しやすくする機能を用意した。
ハードウェア構成では、x86サーバをベースに18台のデータノードと冗長化された2台のマスタノード、10ギガビットと40ギガビットのイーサネットを組み合わせた。データノードの内蔵ディスクはHDFS(Hadoop Distributed File System:Hadoop分散ファイルシステム)でフォーマットされている。データを圧縮して格納しており、1ペタバイトを格納できるとしている。
ソフトウェア事業インフォメーションマネジメント事業分の事業部長、望月敬介氏は「既にHadoopをうまく使いこなしている企業はむしろ対象ではない」と話す。オープンソースであるHadoopによるシステム構築に苦労しているとの声が寄せられているため、BigInsightsなどによって付加価値をつけることで、企業によるHadoopシステムの導入を支援する考えだ。
NetezzaのFPGAが強み
ソフトウェア事業インフォメーションマネジメント事業分の事業部長、望月敬介氏
一方の新製品であるN2002-002は、旧Netezzaの独自設計チップ「FPGA(Field-Programmable Gate Array)」による並列処理技術を用いた高速処理を特徴とする。技術的には、FPGAでディスクから取り出したデータを解凍し、列と行の絞り込みによって検索処理の対象になっているデータだけを取り出し、CPUで処理させる。これが高速処理を支えている。
N2002-002のブレード搭載数は2でコア数は最大32。搭載メモリは128Gバイト。搭載総ディスク容量は8Tバイトとなっている。
技術面の説明をしたソフトウェア事業インフォメーション・マネジメント事業分のBigData Technical Salesの一志達也氏は、N2002-002の並列処理の高速性を技術面から説明する。例えば小売業における12カ月分の売り上げ処理をする場合、FPGAとメモリとCPUで構成する1つのシステムを、1月、2月など各月に割り当て12個並べるイメージで処理する。並列する12システムが同時に処理を行うため、全体的に処理が速くなる。Hadoopの分散処理と同様の方法だ。
一志氏によると、1つの課題は「2月のデータのみを集計してほしい」といったリクエストをいかに高速に処理するかだという。月ごとに1つのシステムを別々に処理しているため、「2月分」に絞り込んでしまうと、ひもづく1つのシステムでしか処理ができないため、12システムによる並列処理の高速性を発揮できないとのこと。
このあたりは、OracleやSAPがインメモリ処理をベースにしたカラム型データベースが得意とする集計処理でもある。一志氏は「N2002-002は高速処理を実施するためのアーキテクチャのバランスの良さが売り。IBMもカラム型データベース製品があり、システムに要求する処理によって使い分ける必要がある」と話していた。
新製品の価格は、PureData System for Hadoop H1001が7000万円程度。PureData System for Analytics N2002-002は6000万円程度。いずれもオプションの追加などによって金額が変わってくる。
Keep up with ZDNet Japan
ZDNet JapanはFacebook、Twitter、RSS、メールマガジンでも情報を配信しています。