SAS、Hadoopデータを直接分析できるソフト--データサイエンティストを解放

齋藤公二 (インサイト)

2014-04-17 18:32

 SAS Institute Japanは4月17日、分散並列処理プログラミングフレームワークの「Apache Hadoop」上で分析するためのソフトウェア「SAS In-Memory Statics for Hadoop」とマウスを使ったビジュアルアナリティクスを支援するビジネスユーザー向けソフトウェアの新版「SAS Visual Analytics 6.4」を発表した。

 データサイエンティスト向けのIn-Memory Statics for Hadoopでは、Hadoopが苦手とされてきた機械学習処理の性能を向上させた。独自の分散並列インメモリ処理技術「SAS LASR Analytic Server」を活用した。ビジュアルな分析とインタラクティブなプログラミング環境である「SAS Studio」も提供する。これにより、データサイエンティストをITスキルやHadoopスキルから解放するという。米国では3月12日にリリースされた。

 Visual Analytics 6.4では、テキストデータや非構造化データ分析機能、セルスサービス機能、モバイル機能、オフィス製品との連携などが強化された。Hadoopとの連携では、LASR Analytic Serverを使ってHadoopクラスタからのデータロード時間を大幅に短縮した。半年に一度、バージョンアップをリリースするスケジュールになっており、6.4は4月1日にリリースされた。

北川裕康氏
SAS Institute Japan マーケティング&ビジネス推進本部長 北川裕康氏
小林泉氏
SAS Institute Japan ビジネス推進本部アナリティクスプラットフォーム推進 小林泉氏

 マーケティング&ビジネス推進本部長の北川裕康氏は、SASが進めるアナリティクスの“モダナイゼーション”戦略を解説した。ここで言うモダナイゼーションとは、新しいデータやビジネス環境に対応していくために、データやビジネスのための分析基盤を“近代化”していくことを指している。そのためには、データやテクノロジといったインフラを整備するだけでなく、人やプロセスを含めて取り組んで企業文化として根付かせていくことが必要だという。

 「分析のライフサイクルを工場に見立てて、各プロセスが工場内のベルトコンベアを流れるように高速に効率的に進むような活動を提案している。テクノロジの近代化という意味では、Hadoopを中心とした取り組みを推進している」(北川氏)

 ビジネス推進本部アナリティクスプラットフォーム推進の小林泉氏は同社のHadoop戦略として、Hadoop上でデータの管理や探索、予測モデリング、モデル配置などの分析ライフサイクル全体を実現していくと解説した。「Hadoopを使って蓄積保存したデータをSASのアナリティクス製品を使って分析し、ビジネス価値を創造していくことを目指す」という。

 新製品のIn-Memory Statics for Hadoopでは、Hadoop上で分析する上での課題になっていた、機械学習処理の性能や分析手法の機能不足、Javaプログラミングなど複雑なITスキルの必要性などに対応したという。機械学習処理の性能では、LASR Analytic Serverという機械学習処理専用の独自のMPI(Message Passing Interface)フレームワークを使用した分散並列型インメモリアナリティクスエンジンを使うことで、大幅に向上させたとしている。

説明 2014年にリリースする予定のHadoop関連製品
※クリックすると拡大画像が見られます

 分析手法については、Hadoop上で回帰分析や決定木、k-meansクラスタリング、テキスト解析、協調フィルタリング、アソシエーションなどを直接実行できるようにした。そのためのツールであるSAS Studioでは、Hadoop上のデータをRDBMSのようなテーブルとして扱うことができ、分析したいコードをマウスで選択して実行すると、その場で分析結果を得ることができる。グラフや表をその場で作成したり、一度読み込んだデータを再利用しつつ複数ユーザーでアドホックに分析したりといったことも可能だ。

 「単一プログラミング環境により、ITスキルやHadoopスキルを不要とし、思考のままにビジュアルに高速にHadoopにあるデータを分析できるようになる。Hadoopにデータが貯まっているという企業が増えているが、データサイエンティストとしてすべてのスキルを持った人材は不足している。Hadoopクラスタ環境のROI(投資対効果)を高めつつ、必要スキルの敷居を下げることで分析組織の立ち上げ、育成を支援したい」(小林氏)

 Hadoop関連製品のリリースは今後も続く予定で、2014年後半には、データ管理製品として「SAS Code Accelerator for Hadoop」「SAS Data Quality Accelerator for Hadoop」「SAS Data Director for Hadoop」、データ探索や予測モデリング関連で「SAS Visual Statistics」などを提供するという。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    ChatGPTに関連する詐欺が大幅に増加、パロアルトの調査結果に見るマルウェアの現状

  2. セキュリティ

    迫るISMS新規格への移行期限--ISO/IEC27001改訂の意味と求められる対応策とは

  3. セキュリティ

    警察把握分だけで年間4000件発生、IPA10大脅威の常連「標的型攻撃」を正しく知る用語集

  4. セキュリティ

    いま製造業がランサムウェアに狙われている!その被害の実態と実施すべき対策について知る

  5. セキュリティ

    ランサムウェア攻撃に狙われる医療機関、今すぐ実践すべきセキュリティ対策とは?

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]