SAS、Hadoopデータを直接分析できるソフト--データサイエンティストを解放

齋藤公二 (インサイト) 2014年04月17日 18時32分

  • このエントリーをはてなブックマークに追加

 SAS Institute Japanは4月17日、分散並列処理プログラミングフレームワークの「Apache Hadoop」上で分析するためのソフトウェア「SAS In-Memory Statics for Hadoop」とマウスを使ったビジュアルアナリティクスを支援するビジネスユーザー向けソフトウェアの新版「SAS Visual Analytics 6.4」を発表した。

 データサイエンティスト向けのIn-Memory Statics for Hadoopでは、Hadoopが苦手とされてきた機械学習処理の性能を向上させた。独自の分散並列インメモリ処理技術「SAS LASR Analytic Server」を活用した。ビジュアルな分析とインタラクティブなプログラミング環境である「SAS Studio」も提供する。これにより、データサイエンティストをITスキルやHadoopスキルから解放するという。米国では3月12日にリリースされた。

 Visual Analytics 6.4では、テキストデータや非構造化データ分析機能、セルスサービス機能、モバイル機能、オフィス製品との連携などが強化された。Hadoopとの連携では、LASR Analytic Serverを使ってHadoopクラスタからのデータロード時間を大幅に短縮した。半年に一度、バージョンアップをリリースするスケジュールになっており、6.4は4月1日にリリースされた。

北川裕康氏
SAS Institute Japan マーケティング&ビジネス推進本部長 北川裕康氏
小林泉氏
SAS Institute Japan ビジネス推進本部アナリティクスプラットフォーム推進 小林泉氏

 マーケティング&ビジネス推進本部長の北川裕康氏は、SASが進めるアナリティクスの“モダナイゼーション”戦略を解説した。ここで言うモダナイゼーションとは、新しいデータやビジネス環境に対応していくために、データやビジネスのための分析基盤を“近代化”していくことを指している。そのためには、データやテクノロジといったインフラを整備するだけでなく、人やプロセスを含めて取り組んで企業文化として根付かせていくことが必要だという。

 「分析のライフサイクルを工場に見立てて、各プロセスが工場内のベルトコンベアを流れるように高速に効率的に進むような活動を提案している。テクノロジの近代化という意味では、Hadoopを中心とした取り組みを推進している」(北川氏)

 ビジネス推進本部アナリティクスプラットフォーム推進の小林泉氏は同社のHadoop戦略として、Hadoop上でデータの管理や探索、予測モデリング、モデル配置などの分析ライフサイクル全体を実現していくと解説した。「Hadoopを使って蓄積保存したデータをSASのアナリティクス製品を使って分析し、ビジネス価値を創造していくことを目指す」という。

 新製品のIn-Memory Statics for Hadoopでは、Hadoop上で分析する上での課題になっていた、機械学習処理の性能や分析手法の機能不足、Javaプログラミングなど複雑なITスキルの必要性などに対応したという。機械学習処理の性能では、LASR Analytic Serverという機械学習処理専用の独自のMPI(Message Passing Interface)フレームワークを使用した分散並列型インメモリアナリティクスエンジンを使うことで、大幅に向上させたとしている。

説明 2014年にリリースする予定のHadoop関連製品
※クリックすると拡大画像が見られます

 分析手法については、Hadoop上で回帰分析や決定木、k-meansクラスタリング、テキスト解析、協調フィルタリング、アソシエーションなどを直接実行できるようにした。そのためのツールであるSAS Studioでは、Hadoop上のデータをRDBMSのようなテーブルとして扱うことができ、分析したいコードをマウスで選択して実行すると、その場で分析結果を得ることができる。グラフや表をその場で作成したり、一度読み込んだデータを再利用しつつ複数ユーザーでアドホックに分析したりといったことも可能だ。

 「単一プログラミング環境により、ITスキルやHadoopスキルを不要とし、思考のままにビジュアルに高速にHadoopにあるデータを分析できるようになる。Hadoopにデータが貯まっているという企業が増えているが、データサイエンティストとしてすべてのスキルを持った人材は不足している。Hadoopクラスタ環境のROI(投資対効果)を高めつつ、必要スキルの敷居を下げることで分析組織の立ち上げ、育成を支援したい」(小林氏)

 Hadoop関連製品のリリースは今後も続く予定で、2014年後半には、データ管理製品として「SAS Code Accelerator for Hadoop」「SAS Data Quality Accelerator for Hadoop」「SAS Data Director for Hadoop」、データ探索や予測モデリング関連で「SAS Visual Statistics」などを提供するという。

ZDNet Japan 記事を毎朝メールでまとめ読み(登録無料)

  • このエントリーをはてなブックマークに追加

この記事を読んだ方に

関連ホワイトペーパー

連載

CIO
シェアリングエコノミーの衝撃
デジタル“失敗学”
コンサルティング現場のカラクリ
Rethink Internet:インターネット再考
インシデントをもたらすヒューマンエラー
トランザクションの今昔物語
エリック松永のデジタルIQ道場
研究現場から見たAI
Fintechの正体
米ZDNet編集長Larryの独り言
大木豊成「仕事で使うアップルのトリセツ」
山本雅史「ハードから読み解くITトレンド放談」
田中克己「展望2020年のIT企業」
松岡功「一言もの申す」
松岡功「今週の明言」
内山悟志「IT部門はどこに向かうのか」
林 雅之「デジタル未来からの手紙」
谷川耕一「エンプラITならこれは知っとけ」
大河原克行「エンプラ徒然」
内製化とユーザー体験の関係
「プロジェクトマネジメント」の解き方
ITは「ひみつ道具」の夢を見る
セキュリティ
エンドポイントセキュリティの4つの「基礎」
企業セキュリティの歩き方
サイバーセキュリティ未来考
ネットワークセキュリティの要諦
セキュリティの論点
スペシャル
エンタープライズAIの隆盛
インシュアテックで変わる保険業界
顧客は勝手に育たない--MAツール導入の心得
「ひとり情シス」の本当のところ
ざっくり解決!SNS担当者お悩み相談室
生産性向上に効くビジネスITツール最前線
ざっくりわかるSNSマーケティング入門
課題解決のためのUI/UX
誰もが開発者になる時代 ~業務システム開発の現場を行く~
「Windows 10」法人導入の手引き
ソフトウェア開発パラダイムの進化
エンタープライズトレンド
10の事情
座談会@ZDNet
Dr.津田のクラウドトップガン対談
Gartner Symposium
IBM World of Watson
de:code
Sapphire Now
VMworld
Microsoft WPC
Microsoft Connect()
HPE Discover
Oracle OpenWorld
Dell Technologies World
AWS re:Invent
AWS Summit
PTC LiveWorx
吉田行男「より賢く活用するためのOSS最新動向」
古賀政純「Dockerがもたらすビジネス変革」
中国ビジネス四方山話
ベトナムでビジネス
日本株展望
企業決算
このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]