UDAの中で、TeradataとAster、そしてHadoopという3つのプラットフォームにあるデータはそれぞれの間を移動できる。HadoopからAsterには「Aster Connector for Hadoop」、HadoopからTeradataには「Teradata Connector for Hadoop」、TeradataとAsterの間は「Aster Teradata Connector」といった具合だ。これらの技術で解析対象となるデータの構造に適したプラットフォームで処理しつつ、必要に応じてデータを移動させることができるという。
データへのアクセスは、先に挙げたSQL-Hとともに、Teradataにクエリを実行する、現行のクライアントソフトウェア「Teradata SQL Assistant」をAster向けに拡張して提供する(4月に提供予定)。UDAでのデータの管理は、Teradata用のデータベース監視ソフトウェア「Teradata Viewpoint」をAsterとHadoop向けに拡張して、複数のプラットフォームを一元的に管理できるようにする(6月に提供予定)。
日本テラデータのマーケティング統括部で統括部長を務める中村博氏はUDAのメリットについて「SQLで大容量のデータを分析できることに加えて、SQL以外の分析もできる。サイズに関係なく、前処理が必要な非構造化データ、関係が不明な新しいタイプのデータも分析できる」と説明。非構造化データの分析では「高速で反復的な並列処理を実現できるMapReduceのパワーを活用できる」とメリットを強調している。

Teradata Aster Big Analytics Appliance
今回発表された、非構造化データも対象にして分析する専用機と言えるAster Big Analytics Applianceは、同社のUDAの中から編み出されている。税別価格は最小構成で4500万円から。
このマシンは、Asterとデータ管理プラットフォームのHDPを単一の筐体にまとめ上げたものであり、UDAに含まれるさまざまなコンポーネントが組み込まれている。既存のBIやETLのツールを有効活用できる。
導入後すぐに利用できる分析アプリケーションは、Aster MapReduce Analytics Portfolioとして提供される。シーケンシャルデータ内にあるパターンを発見するのをサポートする「PATH」、統計分析処理をサポートする「STATISTICAL」、テキストからパターンや特色を導出するのサポートする「TEXT ANALYSIS」、マーケティングを最適化するための顧客分析をサポートする「MARKETING」など約70もの関数が含まれている。
マシンは、Asterノード、HDPノード、ソフトウェア、ストレージ、バックアップ、イッチがまとめられている。ノード間のインターコネクトは40GbpsのInfiniBandで接続。ノードあたりのメモリは256Gバイト。Aster単体で提供されていたアプライアンス「Teradata Aster MapReduce Appliance」と比べて、ラックあたりのCPU性能は2.5倍、搭載メモリは7倍、ストレージ容量は6.5倍と説明している。

Aster Big Analytics Applianceの概要
日本テラデータの一柳健太氏(ビッグアナリティクス統括部)は、Asterを活用した事例を説明している。米小売業での関連購買(バスケット分析)での活用事例だ。バスケット分析は、消費者がどういった商品を同時に買う傾向が強いのかを分析するものであり、ビッグデータ登場以前から行われている。
一柳氏が紹介する事例では、1つの商品カテゴリに対する併売率と傾向値を分析する際、これまでは対象となる期間が13週間をSQLで分析すると、4時間もかかっていたという。これをAsterでバスケット分析すれば、12の商品カテゴリのすべてのパターンの併売率と傾向値を分析できるという。しかも対象期間は8年間という。SQL-MapReduceを活用すると、分析時間はたったの48分で済んでいる。

一柳健太氏
また別の小売業でのバスケット分析は「バナナと牛乳、どちらが値上がりするとバスケットボリュームへの影響が大きいのか?」というものだ。この事例では、過去6年間のデータをSQL-MapReduceで分析、1時間半で分析が終了している。
分析からは「牛乳の価格が上がると、牛乳単品の売り上げも減るし、バナナとの併売率も落ちる」(一柳氏)ことが分かっている。その逆に「バナナの価格が上がっても、バナナ単品の売り上げ、牛乳との併売率への影響は少ない」ことも明らかになっている。