ネットワークを中心に据えたイベント「Interop」でビッグデータをビジネスに生かそうとするヤフーが、その取り組みの一端を明らかにした。
ヤフーは検索された言葉のログやQ&Aサービス「ヤフー知恵袋」、ECサービス「ヤフーショッピング」などさまざまな事業ごとのビッグデータを有している。語句の検索数が多い季節や、地域などに着目し、商品が売れる月を可視化、予測できるため、これらの情報をもとにコンサルティングなどをサービスとして扱う。さらに製品名や会社名などの検索数をもとに流行を予測しているという。また、2011年からTwitterと戦略的業務提携を結んでおり、全ツイートデータを自社のデータと組み合わせてリアルタイムに活用している。
ヤフー データ&サイエンスディレクター 小間基裕氏
「検索キーワードや行動ログを使うだけではなく、Twitterのツイートデータを組み合わせることで予測の精度を大幅に上げることができる」(ヤフー データ&サイエンスディレクター 小間基裕氏)
このほかビッグデータを利用し、検索連動型広告やターゲティング広告、ECサービスで取り扱う在庫の最適化をしている。
データで経営のスピードアップに貢献
実際にビッグデータを利用するためにどのような体制を組んでいるのだろうか。小間氏の統括するチームはデータやサイエンスを利用し、課題解決に貢献することをミッションとしている。小間氏は“データが経営に役立つこと”を経営陣に説明する点に注力したという。データを経営に生かすことにより、今どんな問題がおこっているかを知る「認知」、会議の意志決定などの「判断」、そして「実行」の3つをスピードアップした。
具体的には“認知”のスピードアップのため、全社的なメールや、必要な検索項目が分かる「ダッシュボード」の仕組みを整え、経営陣がデータを活用しやすくした。毎日、毎時間、判断に必要な情報が適切に担当者のもとに届くシステムを構築したのだ。「一見、何でもないことのように聞こえるが実際にこれができている会社は少ない」(小間氏)
判断のスピードを上げるために、マーケティングでのABテストの結果を共有することに加え、経営陣のアドホックな集計の要求に対応できる体制を作っているという。また、データ利用やログのナレッジベースを構築し、過去の事例から事態の予測に役立つ環境を作っているとした。
実行のスピードアップには、データ利用のインフラを整備し、依頼者が情報システム部の作業を待たなくても自分で処理できるようにした。具体的には、Hadoopクラスタ、Teradataなどのデータウェアハウス(DWH)、RDBMSにMySQLやOracle Databaseを活用した基盤を作り、データソースをまたいだデータの集計や前処理などの作業を自動化しているとした。
データ活用のためのシステム