データウェアハウス(DWH)大手の米Teradataは、米国時間10月19~23日の5日間、テネシー州ナッシュビルでコンファレンス「Teradata 2014 PARTNERS」を開催している。
28年目となる今回のテーマは「Data Driven」。肥大化するデータ量と構造化か非構造化を問わず多様化するデータ群をいかに効率よく利活用してビジネスを強化するかに主眼においたものだ。期間中は世界51カ国から約4000人のパートナー企業やユーザー企業が集い、日本からも約40人が参加している。
PARTNERSは、ユーザー企業による事例紹介セッションが多く設けられている。今回も約200のブレイクアウトセッション中、60%がユーザー企業によるセッションとなっている。従来はIT部門を対象にしたテクニカルセッションがメインであったが、今回はビジネス部門やマーケティング部門を対象にしたセッションが充実しているのも特徴だ。
会場となったGaylord Opryland Resort & Convention Center
※クリックすると拡大画像が見られます
1日で250Tバイトが蓄積されるeBay
初日となる10月19日には、54のブレイクアウトセッションが開催された。中でも米eBayの「Extreme Analytics @eBay(eBayの卓越した分析力)」には、日曜日の午前中にもかかわらず、100人を超える聴講者が詰めかけた。
登壇したシニアアーキテクトのTom Fastner氏によると、eBayの利用者は1億5000万人で、扱う品目は毎日8000億。1日あたり250Tバイトのデータが蓄積され、15Tバイトの半構造化データを処理しているという。さらに、1テーブルに6Pバイトの生データ、1万以上の分析タグ、5万5000のバッチ処理が行われており、1時間あたりのバックアップ量は40T~45Tバイトにも上るとのことだ。
同社では、構造化データをTeradataの大規模環境向けDWH製品「Enterprise Data Warehouse(EDW)」、半構造化データを「Singularity」、非構造化データを「Hadoop」で分析、管理している。
Fastner氏は「われわれがHadoopで最初に行った分析は“発見”だった」と語る。その発見とは、商品画像のクオリティと販売価格の因果関係分析だ。
数ペタバイトに上る画像データを分析し、商品写真のピントや背景色などをDWHに格納されているトランザクションデータと照会したところ、商品画像のクオリティと落札価格は比例することが明らかになった。以降、同社では出展者に対して質のよい画像を掲載するよう指導したり、同社側で背景色を自動的に変更したりしているという。
自然言語処理にも注力している。出展者の製品紹介文(自由記述)を自動で判別し、カテゴリ分類する必要があるからだ。「例えば“ピンク”という単語でも、色を表しているのか、バンド名なのか、ファッションブランドなのかを前後のコンテキストから見極める必要がある」(Fastner氏)。こうした分析もすべてHadoopで構造化し、フィルタリング処理していると説明した。
※クリックすると拡大画像が見られます
組織のサイロ化解消に財務データ分析を活用
膨大な非構造化データを分析し、顧客と自社の売上増加を実現しているのがeBayなら、社内の課題発見のため、意外な部門のデータ分析に着手し、課題解決の一助とした企業がある。ディーゼルエンジンの製造を手掛ける米Cumminsだ。同社では財務会計部門が所有する総勘定元帳、売掛金、買掛金の3つを分析し、各部門での業務の“ムダ”を可視化した。
多くの製造業では、組織構造が縦割りとなっている。各組織が独自のシステムを導入した結果、組織が“サイロ化”し、コスト効率の悪いシステムと体制が固定化してしまっている。同社でファイナンスBIリードを務めるRajib Panda氏は、「各担当者に聞き取り調査をした結果、レポートラインが複雑化していることが見えてきた。そこでわれわれは3つのERP(統合基幹業務システム)を統合し、1つのリポーティング体制を構築した」と説明する。
財務会計部門のデータを一元化し、24あった階層を統合したことで、部門横断的なエンドトゥエンドの分析と、全社共通のBIツールで各部門の財務状況を分析できるようになった。さらに、メタデータ駆動型のカスタマイゼーションが可能となったほか、監査やセキュリティも共通化され「ビジネスの透明性も向上した」という。
2日目となる10月20日は、基調講演にTeradataの最高経営責任者(CEO)であるMichael Koehle氏らが登壇し、今後のビジョンなどを披露する予定となっている。