モバイルゲームやWebサービスにおける膨大なアクセスログの解析や、エンタープライズ分野における顧客行動やIoTデータの分析など、膨大かつ多種多様なデータが、新たなビジネスチャンスを生み出す源泉として注目を集めている。
このようなビッグデータ解析に最適なのが、IBMが提供するクラウドDB+ビッグデータ解析サービス「dashDB」である。かつてないスピード感で柔軟に活用できるだけでなく、幅広い用途に対応しつつ、データの相互運用性に優れ、バックアップやチューニングなどの運用作業が不要といった特徴を持つ。
今回、この「dashDB」と関連サービスについて、そのポイントと簡単な始め方を解説する。これまで、企業向けのデーターベースシステムは、IT部門のエンジニアが数ヶ月かけて準備するといったものだった。しかし、「dashDB」なら、ほんの3ステップ・数分あれば、まるでオンラインソフトウェアを試すように、誰でも本格的に利用することができる。
企業は、その活動に応じて膨大なデータを集めているが、これまで、その一部分しか活用できていなかったり、集計や分析に膨大なコストがかかっていた。たとえば、ERPであれば、基幹業務に限定してデータを短期間だけ集計・分析していた。数年前に流行したDWH(データウェアハウス)では、もう少し期間と収集データの範囲を拡大することができたが、こういう角度で分析したいという要望に応じて、1年かけて準備して、3年かけて我慢して使うというのが実情だった。しかし、ビジネスを取り巻く環境の変化は激しくなっており、あらかじめ決まったデータ分析軸では追従が困難になっていた。
クラウド技術の発達が、この状況を一変させた。データサイエンティストや現場の担当者が、自由に使えるビッグデータ解析環境を提供することで、思いついたことを、すぐに試すことが可能になったのだ。
その結果、分析結果から起こすアクションにも、格段のスピードアップが求められるようになってきた。ERPやDWHによる分析であれば、レポート作成者とは別に、経営陣が、数ヶ月に一度、企業活動の方向性を判断すれば済んでいた。しかし、思考スピードで分析できるようになれば、データのインサイトに踏み込んで、素早いアクションが不可欠になった。
IBMは、このような企業活動の変化に応えるため、クラウド上のデータベース環境の拡充に努めてきた。
ビッグデータ解析に最適なクラウドDBサービス「dashDB」
クラウドDBサービスは、2つの軸で整理できる。まずは、分析用とトランザクション用という処理形態に応じた軸。もうひとつは、構造化と非構造化というデータ形式の軸だ。IBMは、次の図のように、この全ての領域で、クラウドDBサービスを提供している。
IBMが提供するクラウドDBサービスは、クラウドDBサービス間の相互運用性が高く、バックアップやチューニングなど運用作業が不要なフルマネージドサービスになっている(DB2 on Cloudをのぞく)。
そんな中で、ビッグデータ解析に最適なクラウドDBサービスが「dashDB」である。
「簡単にいうと、dashDBとは、クラウドで利用できるデータウェアハウス as a Serviceと言えます。オンライントランザクションよりも、参照・集計に優れており、クラウドサービスとして、かつてないスピード感で柔軟に活用できます」
このように語ってくれたのは、日本IBMのアナリティクス事業部でインフォメーション・アーキテクトを務める野間 愛一郎氏である。そして、dashDBの特徴は、フルマネージドなクラウドDBサービスであることに加えて、アナリティクスに特化して、高いパフォーマンスを発揮する点にあるという。そのために、インメモリ・カラム方式やインメモリ最適といった、DB2で培われたBLUアクセラレーション技術を採用している。
dashDBは、他社のクラウドDBサービスと比較しても、使い勝手を向上させる多様な機能を備えており、IT技術者でなくても使いこなせるクラウドDBサービスになっているという。
「dashDBが圧倒的に優れているのは、データを用意してから使い始めるまでの時間が極めて短いことです。ロード&ゴーというように、お客様は、すぐに使うことができます。データをアップロードしたり、既存のクラウド環境と接続するだけで、自動的にデータ構造を認識し、あとはウィザードで設定を進めるだけで使い始めることができるよう、丁寧に作り込んであります」(野間氏)