SAS Institute Japanは4月17日、分散並列処理プログラミングフレームワークの「Apache Hadoop」上で分析するためのソフトウェア「SAS In-Memory Statics for Hadoop」とマウスを使ったビジュアルアナリティクスを支援するビジネスユーザー向けソフトウェアの新版「SAS Visual Analytics 6.4」を発表した。
データサイエンティスト向けのIn-Memory Statics for Hadoopでは、Hadoopが苦手とされてきた機械学習処理の性能を向上させた。独自の分散並列インメモリ処理技術「SAS LASR Analytic Server」を活用した。ビジュアルな分析とインタラクティブなプログラミング環境である「SAS Studio」も提供する。これにより、データサイエンティストをITスキルやHadoopスキルから解放するという。米国では3月12日にリリースされた。
Visual Analytics 6.4では、テキストデータや非構造化データ分析機能、セルスサービス機能、モバイル機能、オフィス製品との連携などが強化された。Hadoopとの連携では、LASR Analytic Serverを使ってHadoopクラスタからのデータロード時間を大幅に短縮した。半年に一度、バージョンアップをリリースするスケジュールになっており、6.4は4月1日にリリースされた。
SAS Institute Japan マーケティング&ビジネス推進本部長 北川裕康氏
SAS Institute Japan ビジネス推進本部アナリティクスプラットフォーム推進 小林泉氏
マーケティング&ビジネス推進本部長の北川裕康氏は、SASが進めるアナリティクスの“モダナイゼーション”戦略を解説した。ここで言うモダナイゼーションとは、新しいデータやビジネス環境に対応していくために、データやビジネスのための分析基盤を“近代化”していくことを指している。そのためには、データやテクノロジといったインフラを整備するだけでなく、人やプロセスを含めて取り組んで企業文化として根付かせていくことが必要だという。
「分析のライフサイクルを工場に見立てて、各プロセスが工場内のベルトコンベアを流れるように高速に効率的に進むような活動を提案している。テクノロジの近代化という意味では、Hadoopを中心とした取り組みを推進している」(北川氏)
ビジネス推進本部アナリティクスプラットフォーム推進の小林泉氏は同社のHadoop戦略として、Hadoop上でデータの管理や探索、予測モデリング、モデル配置などの分析ライフサイクル全体を実現していくと解説した。「Hadoopを使って蓄積保存したデータをSASのアナリティクス製品を使って分析し、ビジネス価値を創造していくことを目指す」という。
新製品のIn-Memory Statics for Hadoopでは、Hadoop上で分析する上での課題になっていた、機械学習処理の性能や分析手法の機能不足、Javaプログラミングなど複雑なITスキルの必要性などに対応したという。機械学習処理の性能では、LASR Analytic Serverという機械学習処理専用の独自のMPI(Message Passing Interface)フレームワークを使用した分散並列型インメモリアナリティクスエンジンを使うことで、大幅に向上させたとしている。
※クリックすると拡大画像が見られます
※クリックすると拡大画像が見られます
分析手法については、Hadoop上で回帰分析や決定木、k-meansクラスタリング、テキスト解析、協調フィルタリング、アソシエーションなどを直接実行できるようにした。そのためのツールであるSAS Studioでは、Hadoop上のデータをRDBMSのようなテーブルとして扱うことができ、分析したいコードをマウスで選択して実行すると、その場で分析結果を得ることができる。グラフや表をその場で作成したり、一度読み込んだデータを再利用しつつ複数ユーザーでアドホックに分析したりといったことも可能だ。
「単一プログラミング環境により、ITスキルやHadoopスキルを不要とし、思考のままにビジュアルに高速にHadoopにあるデータを分析できるようになる。Hadoopにデータが貯まっているという企業が増えているが、データサイエンティストとしてすべてのスキルを持った人材は不足している。Hadoopクラスタ環境のROI(投資対効果)を高めつつ、必要スキルの敷居を下げることで分析組織の立ち上げ、育成を支援したい」(小林氏)
Hadoop関連製品のリリースは今後も続く予定で、2014年後半には、データ管理製品として「SAS Code Accelerator for Hadoop」「SAS Data Quality Accelerator for Hadoop」「SAS Data Director for Hadoop」、データ探索や予測モデリング関連で「SAS Visual Statistics」などを提供するという。