編集部からのお知らせ
「ZDNet Japan Summit」参加登録受付中! 
新着記事集:「負荷分散」

ビッグデータにはビッグアナリティクスが必要--Teradata PARTNERS 2010 - (page 3)

田中好伸(編集部)

2010-10-29 12:02

 eBayでは、ビジネスの拡大や効率性向上を求めて一般のネットサービス企業と同様に、ユーザーのトランザクションやユーザーがサイト上でどのように振る舞うのか、ログを取っている。どういった商品が売れて何が売れていないのか分析するとともに、ユーザーの行動を分析することでサービス品質の向上を目指している。そうした結果として1日あたりのクエリが数百万になるというわけだ。しかしその数も「今後500万から1000万になるだろう」(Ratzesberger氏)との見方を示している。

 そのデータ分析基盤としてeBayはTeradataのデータウェアハウス製品を活用するとともに、Hadoopをベースにしたシステムを組んで活用している。eBayのデータ基盤は3つに大別でき、全社向けのエンタープライズデータウェアハウスと「Singularity」と呼ばれるデータ基盤、そしてHadoopをベースにしたデータ基盤だ。

 エンタープライズデータウェアハウスのデータ量は6ペタバイト、同時利用ユーザー数は500以上。このエンタープライズデータウェアハウスは比較的定型的な分析やレポートとして活用されている。

 Singularityと呼ばれるデータ基盤も定型的な分析やレポートとして活用されているが、このデータ基盤は、より複雑な発見や探索にも利用されている。“コンテキスチャルアナリティクス”と呼ばれる複雑な分析に活用することができる。同時利用ユーザー数は50以上、データの量は10ペタバイト以上となっている。

 そして、より複雑な分析の基盤となるのがHadoopベースのデータ基盤だ。同時利用ユーザー数は5〜10程度で、データ容量は5ペタバイト以上となっている。

 eBayが、これら3つのデータウェアハウスを活用するには、それぞれが異なる特性を持っているからだ。ワークロードの管理や同時利用ユーザー数、I/O性能などはエンタープライズデータウェアハウスが優れている。しかし、分析の柔軟性ではHadoopベースのものが優れている。また、Singularityは容量が大きいという利点がある。それぞれのメリットを生かす形で活用しているのである。「技術に“銀の弾丸”は存在しない」とRatzesberger氏は説明している。

 eBayのデータウェアハウスの活用で興味深いのは、3つあるデータ基盤に入れるデータの種類が異なるという点だ。エンタープライズデータウェアハウスには、いわゆる構造化データを格納している。一方のHadoopベースのものには非構造化データを格納している。

ZDNet Japan 記事を毎朝メールでまとめ読み(登録無料)

特集

CIO

モバイル

セキュリティ

スペシャル

ホワイトペーパー

新着

ランキング

  1. クラウドコンピューティング

    Google Cloudセキュリティ基盤ガイド、設計から運用までのポイントを網羅

  2. セキュリティ

    仮想化・自動化を活用して次世代データセンターを構築したJR東日本情報システム

  3. ビジネスアプリケーション

    スモールスタート思考で業務を改善! 「社内DX」推進のためのキホンを知る

  4. セキュリティ

    Emotetへの感染を導く攻撃メールが多数報告!侵入を前提に対応するEDRの導入が有力な解決策に

  5. セキュリティ

    偽装ウイルスを見抜けず水際対策の重要性を痛感!竹中工務店が実施した2万台のPCを守る方法とは

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNet Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]