韓国のソフトウェアベンダーTmaxSoftは9月11日、データベースの新版「Tibero 6」、データ分析基盤ソフトウェアの新版「InfiniData 3.0」、企業アプリケーション統合(EAI)関連ツールの新版「InfiniLink」、分散キャッシュソフトウェアの新版「InfiniCache 2.0」を発表した。同日に韓国で同社が開催したイベント「Tmax Day 2013」の中で詳細を明らかにした。
Tmaxは、1997年に朴大演(パク・デヨン)氏が創業(現在同社の最高技術責任者=CTO)。2000年にウェブアプリケーションサーバ「JEUS」、メインフレームをUNIXに移行するための製品群「OpenFrame」を展開、2003年からリレーショナルデータベース(RDBMS)のTiberoを提供している。「Oracle Database」互換というTiberoは、これまでに1000以上のサイトで導入され、「韓国内ではデファクトスタンダードのデータベース」(朴氏)という。
今回のTmax Dayのスローガンは「Infini*T:Data Evolution」。同社は、TiberoやInfiniData、InfiniLink、InfiniCacheをまとめてデータ分析関連製品群「Infini*T」として打ち出している。今回のスローガンから分かるように、今回発表された製品は、ユーザー企業がビッグデータでビジネスの成長を遂げることを支援するのを狙っている。
基調講演に登壇したTmaxSoft 最高技術責任者(CTO) 朴大演氏
イベントの基調講演の中で朴氏は、ビッグデータについて「世界各国で企業の制動力として注目されている」とその重要性を強調。朴氏は、McKinseyの調査に触れて、米国内での成長動力として1位のエネルギー、2位の貿易に続いて、3位にビッグデータがあるとして、「企業の生き残り戦略として重要視されている。関心のない産業はない」とビッグデータがビジネスの成長に不可欠であるとの見方を示した。
朴氏の言葉にあるように、世界各国の企業はビッグデータに注目している。では、どんな企業でもうまくデータを活用できているかというと、疑問符をつけざるを得ないだろう。朴氏は「ビッグデータで成功したケースはほとんどないのではないか。成功したのはAmazonやGoogleぐらいだろう」と現状を指摘した。
「ビッグデータの課題のひとつとして、データがテラバイトやペタバイトになるとコストがかかるということがある。解決策として(オープンソースソフトウェア=OSSの分散並列処理プログラミングフレームワーク)“Apache Hadoop”がある。だが、分散処理は難しい。AmazonやGoogleには優秀なエンジニアがいるから成功している」(朴氏)
朴氏は、データを活用するために「収集→保存→分析」という3つの段階(Tmaxは“ライフサイクル”と表現)があると説明。その上で、データの活用で失敗する理由として(1)データの収集段階が標準化されておらず、複雑になっている、(2)データの種類に基づいた分析能力の限界、(3)データ処理の速度や性能の問題、(4)データの全てのフローを統合した基盤の不備――という4つを挙げた。
Infini*Tを構成する4つの新製品が、これらの問題を解決できるというのが朴氏の主張だ。収集にかかわる課題ではInfiniLinkがあり、データの処理ではアプリケーションの性能を加速できるというInfiniCacheが相当し、効率的にデータを保存するものとしてTiberoを活用、総合的にデータを分析する基盤としてInfiniDataを提供する。
技術者に依存的なHadoop
TmaxSoftグループでTiberoを開発するのがTIBEROだ。同社のDBコンサルティング本部 本部長を務める孔相揮(コン・サンフィ)氏は、イベントの中でビッグデータにかかるコストが高いことを示した。Gartnerの調査によると、一般的なITサービス全体に占める人件費とビッグデータにかかる人件費を比較すると、ビッグデータの方が3倍になるという。つまりは、ビッグデータは技術者に依存する状況にあるという現状の課題を明らかにした。
ビッグデータの解決策として注目を集めるのがHadoopだ。非構造化データを処理するのに最適と目されており、分散並列処理フレームワークの事実上標準と言えるだろう。中には「ビッグデータ=Hadoop」とする向きもあるが、あくまでHadoopは分散処理するためのプログラミングフレームワークであって、導入したからといってビッグデータの全てを解決できるというものではない。