日本IBM、Hadoop特化と旧Netezza系の垂直統合型システム2製品を追加

怒賀新也 (編集部) 2013年10月15日 15時33分

  • このエントリーをはてなブックマークに追加

 日本IBMは10月15日、ビッグデータ分析に特化した統合基盤を追加したと発表した。ソフトウェア事業担当の専務取締役執行役員のVivek Mahajan氏はIBMのビッグデータ戦略について、検索、分析、Hadoopによるシステム構築、データ品質保持など「複数の技術を機能を組み合わせたプラットフォーム化が必要と考えている」と指摘。具体的な施策が、ハードウェアとソフトウェアを組み合わせた垂直統合型システムの拡充だ。

日本IBMのソフトウェア事業担当の専務取締役執行役員のVivek Mahajan氏
日本IBMのソフトウェア事業担当の専務取締役執行役員のVivek Mahajan氏

 追加したのは垂直統合型システム「PureData System」の2製品。それぞれ、非構造化データを含む大量データを処理するHadoop向けの新製品「PureData System for Hadoop H1001」と、今年2月に発表した旧Netezza系の分析システムのエントリモデルという位置づけとなる「IBM PureData System for Analytics N2002-002」だ。

Hadoopに特化したアプライアンス

 H1001の特徴は、サイジング、ソフトウェア、ハードウェアなどを含めすべて工場で設定して提供する点にある。特に、IBMがオープンソースのHadoopをより使いやすくするために提供する基盤ソフトウェア「InfoSphere BigInsights」を組み込んでいる点が注目だという。

 BigInsightsには、JDBCやODBCを使ってSQLをHadoop上で扱えるようにするANSI準拠の「BigSQL」、Hadoop用の表計算ツール「BigSheets」、CPUやネットワークの使用率などハードウェアを含めて監視できるアプライアンスならではの管理コンソールなど、Hadoopを運用しやすくする機能を用意した。

 ハードウェア構成では、x86サーバをベースに18台のデータノードと冗長化された2台のマスタノード、10ギガビットと40ギガビットのイーサネットを組み合わせた。データノードの内蔵ディスクはHDFS(Hadoop Distributed File System:Hadoop分散ファイルシステム)でフォーマットされている。データを圧縮して格納しており、1ペタバイトを格納できるとしている。

 ソフトウェア事業インフォメーションマネジメント事業分の事業部長、望月敬介氏は「既にHadoopをうまく使いこなしている企業はむしろ対象ではない」と話す。オープンソースであるHadoopによるシステム構築に苦労しているとの声が寄せられているため、BigInsightsなどによって付加価値をつけることで、企業によるHadoopシステムの導入を支援する考えだ。

NetezzaのFPGAが強み

ソフトウェア事業インフォメーションマネジメント事業分の事業部長、望月敬介氏
ソフトウェア事業インフォメーションマネジメント事業分の事業部長、望月敬介氏

 一方の新製品であるN2002-002は、旧Netezzaの独自設計チップ「FPGA(Field-Programmable Gate Array)」による並列処理技術を用いた高速処理を特徴とする。技術的には、FPGAでディスクから取り出したデータを解凍し、列と行の絞り込みによって検索処理の対象になっているデータだけを取り出し、CPUで処理させる。これが高速処理を支えている。

 N2002-002のブレード搭載数は2でコア数は最大32。搭載メモリは128Gバイト。搭載総ディスク容量は8Tバイトとなっている。

 技術面の説明をしたソフトウェア事業インフォメーション・マネジメント事業分のBigData Technical Salesの一志達也氏は、N2002-002の並列処理の高速性を技術面から説明する。例えば小売業における12カ月分の売り上げ処理をする場合、FPGAとメモリとCPUで構成する1つのシステムを、1月、2月など各月に割り当て12個並べるイメージで処理する。並列する12システムが同時に処理を行うため、全体的に処理が速くなる。Hadoopの分散処理と同様の方法だ。

 一志氏によると、1つの課題は「2月のデータのみを集計してほしい」といったリクエストをいかに高速に処理するかだという。月ごとに1つのシステムを別々に処理しているため、「2月分」に絞り込んでしまうと、ひもづく1つのシステムでしか処理ができないため、12システムによる並列処理の高速性を発揮できないとのこと。

 このあたりは、OracleやSAPがインメモリ処理をベースにしたカラム型データベースが得意とする集計処理でもある。一志氏は「N2002-002は高速処理を実施するためのアーキテクチャのバランスの良さが売り。IBMもカラム型データベース製品があり、システムに要求する処理によって使い分ける必要がある」と話していた。

 新製品の価格は、PureData System for Hadoop H1001が7000万円程度。PureData System for Analytics N2002-002は6000万円程度。いずれもオプションの追加などによって金額が変わってくる。

Keep up with ZDNet Japan
ZDNet JapanはFacebookTwitterRSSメールマガジンでも情報を配信しています。

ZDNet Japan 記事を毎朝メールでまとめ読み(登録無料)

  • このエントリーをはてなブックマークに追加

この記事を読んだ方に

関連ホワイトペーパー

連載

CIO
デジタル“失敗学”
コンサルティング現場のカラクリ
Rethink Internet:インターネット再考
インシデントをもたらすヒューマンエラー
トランザクションの今昔物語
エリック松永のデジタルIQ道場
研究現場から見たAI
Fintechの正体
米ZDNet編集長Larryの独り言
大木豊成「仕事で使うアップルのトリセツ」
山本雅史「ハードから読み解くITトレンド放談」
田中克己「2020年のIT企業」
松岡功「一言もの申す」
松岡功「今週の明言」
内山悟志「IT部門はどこに向かうのか」
林 雅之「デジタル未来からの手紙」
谷川耕一「エンプラITならこれは知っとけ」
大河原克行「エンプラ徒然」
内製化とユーザー体験の関係
「プロジェクトマネジメント」の解き方
ITは「ひみつ道具」の夢を見る
セキュリティ
企業セキュリティの歩き方
サイバーセキュリティ未来考
ネットワークセキュリティの要諦
セキュリティの論点
スペシャル
ざっくりわかるSNSマーケティング入門
課題解決のためのUI/UX
誰もが開発者になる時代 ~業務システム開発の現場を行く~
「Windows 10」法人導入の手引き
ソフトウェア開発パラダイムの進化
エンタープライズトレンド
10の事情
座談会@ZDNet
Dr.津田のクラウドトップガン対談
Gartner Symposium
IBM World of Watson
de:code
Sapphire Now
VMworld
Microsoft WPC
Microsoft Connect()
HPE Discover
Oracle OpenWorld
Dell EMC World
AWS re:Invent
AWS Summit
PTC LiveWorx
吉田行男「より賢く活用するためのOSS最新動向」
古賀政純「Dockerがもたらすビジネス変革」
中国ビジネス四方山話
ベトナムでビジネス
日本株展望
企業決算
このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]