ヤフーはデータ分析基盤を全面更改、2012年11月下旬から稼働させている。日本テラデータが2月13日に発表した。日本テラデータによると日本最大級のデータウェアハウス(DWH)システムになるという。
ポータルサイト「Yahoo! JAPAN」を運営するヤフーは、アクセスログの分析などで2002年からTeradata製品を導入し、社内アナリスト用のデータ分析基盤として利用している。使い勝手の良さから一般の従業員ユーザーが増加したこと、Yahoo! JAPANのサービス拡大に伴って、データ量が急増したことで、データ容量の拡張や性能向上が課題となっていた。
DWHサーバ「Teradata 5500」と「Teradata 5600」の併用システムを全面的に更改し、容量が大きく、性能が高いという現行の最上位機種である「Teradata Active Enterprise Data Warehouse (Avtive EDW)6690」を導入している。更改では、大容量データの分析能力と操作性が優れていることを評価。加えて、少人数で大規模システムの運用管理が可能なことも評価されている。Active EDW 6690のユーザー使用可能領域は6T~53Pバイトとなっている。
ヤフーでは、250人以上の従業員が検索やショッピング、オークションなどさまざまなサービスの利用状況の可視化や広告の効果検証、新サービス開発に向けたシミュレーションなどの目的で日常的にTeradataを活用している。1日あたり12万クエリが実行されているという。
今後ユーザーの増加が見込まれる上、時系列比較を行うための過去データの蓄積、これまでサンプリングしていたアクセスログ、広告ログをすべて格納するといったニーズに応えられるデータ量の処理が可能な環境を構築したと説明している。性能については、従来のシステムに比べて反応時間は2~2.5倍以上向上しているという。
ヤフーは今回、ウェブベースのデータ検索ツール「AccessNavigator Web」も導入している。SQLの知識がなくてもTeradata上のデータを自由に組み合わせて必要な分析ができるようになっているという。SQL教育にかかる時間を削減するとともに、ユーザー自身が高度な分析ができることが期待されるとメリットを強調している。