企業向け情報システムの世界で2010年以降、注目されているのが“Big Data(ビッグデータ)”だ。2010年10月に開催された「Teradata PARTNERS 2010」というイベントの中で、データウェアハウス(DWH)専業企業Teradataのエグゼクティブバイスプレジデント、Darryl McDonald氏はビッグデータの可能性について「データの中にある価値を見つけられる企業は競争優位性を創造できる」と説明している。
ビッグデータを端的に説明するならば、システムが処理するデータが爆発的に増加しているという状況だ。統合基幹業務システム(ERP)や顧客情報管理システム(CRM)などのデータベースに蓄積される構造化データ、企業内の文書類はもちろんのこと、iPhoneなどのスマートフォンからのデータ、GPSによる位置情報、RFIDから出される情報、センサから発信される情報、TwitterやFacebookなどのつぶやき――。ありとあらゆるデータが企業内外に溢れかえっているのである。
こうしたデータを分析するのがビジネスインテリジェンス(BI)であり、対象となるデータを貯め込む場所としてデータウェアハウス(DWH)がある。DWH専業企業として業界の老舗であり、巨人と言えるのがTeradataだ。
同社は2010年11月に記録装置としてハードディスクドライブ(HDD)ではなく、すべてソリッドステートドライブ(SSD)を組み込んだDWHアプライアンス「Teradata Extreme Performance Appliance(EPA)4600」を提供する一方で、HDDとSSDを併用するDWH「Teradata Active Enterprise Data Warehouse(ADW)6650/6680」を今年5月から提供している。
DWH分野は、ユーザー企業から性能向上を常に求められている。ビッグデータが常識となった現在、その声は日に日に高まっている。その解決策としてTeradataは、フルSSDのEPA 4600を提供しており、より経済的な解決策としてADW 6650/6680も提供している。ADW 6650/6680では、頻繁にアクセスされる“ホットデータ”をSSDに、ほとんどアクセスされない“コールドデータ”をHDDに格納するという仕組みを活用して、DWHの経済性を高めようとしている。データの“温度”に注目するのは、 長年DWHを開発し、DWHの使われ方も見ているからといえる。
TeradataでADWなどに携わるプログラムマネジャーのDaniel Graham氏にビッグデータやDWHを取り巻く状況などを聞いた。そこから浮かび上がってくるのは、DWH専業企業としての底力だ。
1984年以来ビッグデータのビジネスを展開
――まず「ビッグデータ」という言葉についてうかがいます。ビッグデータは以前の「Web 2.0」のようにマーケティング上のバズワードという印象があるのですが、米国ではどうとらえられているのでしょうか。
確かに一部ではそういう印象があります。米国でも言葉自体に混乱があって、企業ごとに独自の解釈をしている状況です。ただ、そこに課題があるということは共通の認識です。課題というのはシステムの拡張性や、新しい種類のRAWデータ、つまり簡単には構造化できない生のデータがあるということです。
――ビッグデータが意味するところは「既存のリレーショナルデータベースを中心にしたシステムでは処理しきれないデータ」と考えることができます。そのことについてはどのように考えていますか。
その通りだと思います。ビッグデータは、ハードウェアやソフトウェアといった環境がビッグデータに食われてしまい、性能に影響します。これはコンピュータの大きさの問題ではなく、むしろデータが大きすぎて処理しきれない事態になっているということです。