データレイクのシステム基盤リソースとして
最適なプラットフォームとは
さて、データレイクを実現するには、ソフトウェア基盤のほか、コンピューティングとストレージのハードウェアリソースが必要だ。こうしたリソースをパブリッククラウドで利用することも不可能ではないが、大量のリソースをパブリッククラウド上に確保するには通信コスト含め相当な維持コストがかかるため、オンプレミス環境で整えるのが一般的となる。
では、どのようなハードウェア環境を用意すればいいのか。ハードウェアの導入には事前の検証も必要だが、データ量の増加とともにスケールアウトによる規模拡張も想定するとなれば検証には多大な手間がかかることも予想される。
この課題に対するDell EMCの回答は、3月12日にDell EMCが発表したビッグデータ活用基盤「Dell EMC Elastic Data Platform」だ。本ソリューションは、高速かつ、より少ないコンピュータ リソースで仮想環境を実現できるコンテナ技術の採用やハイブリッドクラウド対応により、インフラストラクチャと運用にかかるTCO(総所有コスト)を最大75%削減することも可能になる。
「Elastic Data Platformはコンテナ技術を取り入れているため、マルチテナント環境におけるシステムリソースをより柔軟に活用できます。また、パブリッククラウドとの親和性も高いのが特徴で、このElastic Data Platformでは、同一のWebインターフェース利用画面でオンプレミスとパブリッククラウドの一元管理が可能な画期的なものです。また、MapRも早くからコンテナ上でのサービス提供を手掛けており、本プラットフォームと高い親和性があります。コンテナベースのため、システムリソースを少なくし、一つのプラットフォーム上でバージョンのディストリビューションが異なるMapR環境を併用する、複数部署で独立した環境を利用できるマルチテナント、利用者自身で利用したい環境、アプリケーションを自分で選択できるセルフサービス利用モデル提供など、柔軟な運用も容易です」(堀田氏)
Dell EMCとMapRは、現在、日本法人どうし、エンジニアからセールス、マーケティングまでの幅広い協業を進めている。実は日本では、両社のプロダクトを組み合わせてビッグデータ基盤を構築・運用しているユーザーが多く、そうした市場ニーズをにらんでのことだ。
「Dell EMCもMapRも、日本において業種業態を問わず広く使われているなど、多くの共通点があるのです。両社のプロダクトを組み合わせた実績も非常に多く、インテル® Xeon® スケーラブル・プロセッサーを搭載したPowerEdgeサーバをベースに、クラスタ十数台から数千台まで幅広い規模でお使いいただいています。協業では、共同検証を行ってリファレンスアーキテクチャを作るなどの取り組みを進めており、これによってユーザーは設計、検証の負荷を軽減することができ迅速な導入が可能です。業界でリーダーシップを持つ企業どうし協力するからこその価値をユーザーに届けていきたいと考えています」と、堀田氏は説明する。
またMapRの三原氏も、今回の日本法人どうしの協業が日本市場ならではのニーズに対応するものとしている。
「日本で独自に協業を進めた理由はいくつかあります。例えば、日本のユーザーは、他の国より確証された信頼性のある環境を求める傾向が強いので、我々が検証することで価値を提供できます。当社はこれまでにも、ISVなどのパートナーと共に検証を行ってホワイトペーパーに取りまとめるなどしてきました。また、日本ではリセラーがSIも手掛けることが多く、そういったエコシステムの違いを踏まえた取り組みという意味もあります」
海外に進出する日本企業も多い中、MapRのソリューションはグローバルなデータレイクとしても使われている。製造業のある企業では、進出先の海外工場から全てのデータを収集、日本の本社に構築したデータレイクにデータを集約し、本社のデータサイエンティストが扱っているという。