EMCジャパンは4月21日、ビッグデータ分析に必要なストレージや仮想化基盤、分析ツールなどに加えてコンサルティングなどのサービスをワンストップで提供する「フェデレーション ビジネス データレイク ソリューション」を発表した。
EMCジャパン 執行役員 グローバルサービス統括本部 プロフェッショナル サービス事業本部長の山口浩直氏は「EMCの発表会だが、今日はストレージの話は一切出てこない」と前置きしてソリューションの内容を説明した。
EMCジャパン 執行役員 グローバルサービス統括本部 プロフェッショナル サービス事業本部長 山口浩直氏
「今回の発表のポイントはアプリケーション、データ、アナリティクス(分析)という連携がグルグル回っていく必要があるという点。企業がモバイルアプリケーションを提供し、ユーザーの声を集めデータとして蓄積する。蓄積されたデータを分析していくわけだが、そこで終わらず分析結果をアジャイル開発でアプリケーションに反映させる。そしてその声をさらにデータとして蓄積し、再び分析し、その結果をアプリケーションにという循環が必要。これをアジャイルグルグルと呼んでいるが、この三角形を循環させていくという提案はわれわれならでは」
ソリューションはEMCのストレージ、VMwareの仮想関連製品、分析レイヤとしてPivotal製品や分析ツール大手企業の製品などで構成される。EMCが7月までに投入予定の「Data Lake Platform Manager」ベースのHadoopディストリビューションとの連携をサポートするビジネスデータレイクも提供する。
データレイクとは、構造化か非構造化を問わずとにかくデータを蓄積し、管理、分析できるようにする状態を指している。データモデルを事前に設計しないことが、これまでのデータ分析とは大きく異なっている。
EMCジャパンは、今回のソリューションについてワンストップでデータレイクを実現できることから、企業側は簡単にデータレイクが実現できるようになると説明。価格や具体的な構築期間は「個々の企業ごとに状況が異なるため、一概に価格、期間はお答えできない」と説明している。
7つの“ない”に対応
今回のソリューションは、短時間で自動的にプロビジョニングを可能とすることで、業務部門のニーズに応えられることが特徴としている。垂直統合システムの「Vblock」をベースに「VMware vSphere」などで仮想化され、事前定義済みのユースケースと自動化されたプロビジョニングと設定機能を、スケールアウト型NAS「EMC Isilon」で容量とパフォーマンスの最適なバランスを実現するというストレージ基盤を提供する。
分析レイヤはHadoopディストリビューション「Pivotal HD」、HadoopにあるデータをSQLで分析できる“SQL on Hadoop”エンジンを特徴とする「Pivotal HAWQ」を含んだ「Pivotal Big Data Suite」で構成される。Big Data SuiteはエンタープライズクラスのSQLと、Hadoopに格納されているデータを通じ、分析ツールとして定評があるSASやTableauなど外部企業の分析プラットフォームとシームレスな統合と相互運用を実現する。今後登場する、ClouderaやHortonworksをはじめとした「Open Data Platform」ベースのHadoopディストリビューションとの連携をサポートするビジネスデータレイクも提供する。
こうした構成とともに「製品を組み合わせるだけでなく、すべてをシングルコールでEMCがサポートすることでユーザー企業はテクノロジ基盤の意思決定ではなく、ビジネスの成果に集中できることが大きなメリット」だと山口氏はアピールした。
ビッグデータ活用を進めるにあたり、企業は「データ活用に必要な要素の7つが“ない”と悩みを抱えている」(山口氏)という。その7つは「組織内に分析スキルがない。人材がいない。データがない。他部門の分析もない。データはあっても分析テーマがない。分析手法に効果が出るか確信がない。何から手をつければよいかわからない。データ分析インフラがない」だ。
「これをEMCのコンサルタント、データサイエンティストが問題解決のお手伝いを行い、データ活用アプローチを提供していく」と全面的な支援策を提供するのが特徴となっている。
具体的なサービスの概要としては、ビッグデータを推進、理解するためのワークショップ、データ活用構想立案サービス、ビジネスへの投資効果などを明らかにするデータ活用PoC(概念実証)サービス、顧客自身がデータ分析、活用できるように支援する分析チーム立ち上げサービス、難易度の高い分析に対する手法などを技術的にサポートするデータ分析高度化サービス、システム構築・運用サービスなどとなっている。
日本での事例として、ある製造業では部品の出荷実績や製品市場利用量、実績などから部品の需要を予測した結果、部品在庫量を大幅に削減し、在庫の適正化を実現したという。別の製造業では、顧客属性や過去のコンタクト履歴、商品利用の特性などから新商品の購入見込み客を予測し、営業ターゲティングを改善し、営業効率が50%以上アップしたとしている。金融業では顧客属性、契約や申し込み内容、履歴などから重点ポイントを絞り込み、審査、契約などの業務プロセス負荷を軽減し、効率化を実現した例などがあるという。
「日本のメンバーがこうした実績を多く持っていることがEMCジャパンならではの強みといえるのではないか」(山口氏)
フェデレーションビジネスデータレイク1.0の構成