昨今、ビッグデータを有効に活用するため、より簡単に、より素早く価値のある情報を引き出す方法を多くの組織が探し求めていますが、Sparkにより、パフォーマンスと開発者の生産性を同時に高めることができるようになります。
●パフォーマンス:Sparkは、インメモリ・パイプラインを用いた汎用の実行フレームワークを提供し、エンド・ツー・エンドのアプリケーション性能を高めることができます。これにより、多くのアプリケーションのパフォーマンスが、5倍〜100倍改善します。
●開発生産性:Sparkジョブのコード量は、通常のHadoopのMapReduceジョブと比較し5分の1程度の行数ですみます。Sparkはシンプルなプログラム抽象化を提供し、開発者はデータセット(RDD, Resilient Distributed Dataset)に対する操作を記述する形でアプリケーションを設計することができます。開発者は、アプリケーションをJavaやScala、Python等の複数のプログラム言語で構築することができると同時に、同じコードをバッチ、インタラクティブ、ストリーミングの処理に再利用することもできます。
現在、多くの企業や組織が既にSparkをMapRの環境で使用しています。これらSparkを基にしたアプリケーションは、エンタープライズ・グレードのHadoopであるMapRディストリビューションの信頼性、パフォーマンス、そしてMapRのDirect Access NFS(TM)による業務データのリアルタイム処理能力の恩恵を受けています。SparkのスタックがMapRのディストリビューションに追加されたことにより、お客様はSparkスタックの全てのプロジェクトの保守サポートを受けることができるようになります。
Sparkスタックは、5つのApacheオープンソースプロジェクトを含みます。MapRディストリビューションはSparkスタックを統合したことにより、20を超えるApacheオープンソースプロジェクトをエコシステムとして内包することになります。これらのプロジェクトにより、ビッグデータをバッチ処理、インタラクティブ処理、ストリーミング、グラフ処理、機械学習といった広範な用途に利用することができるようになります。MapRは、Apacheオープンソースプロジェクトのパッケージを毎月リリースしている唯一のディストリビューターであり、お客様はクラスタ全体をアップグレードするのではなく、ディストリビューションのコンポーネントを個別にアップグレードすることができます。また、本番クラスタサービスに影響を与えるリスクを抑え、オープンソースの革新技術をいち早く利用することが可能です。
【マップアール・テクノロジーズについて】
MapRは、Hadoopを駆使し、ミッションクリティカルかつリアルタイムな業務利用を支援する、エンタープライズ・グレードのプラットフォームを提供 しています。MapRは一つの統合ビッグデータ・プラットフォームの中で、かつてない安定性と使いやすさ、そして世界最高速レベルの処理性能を HadoopやNoSQL、データベース、ストリーミングアプリケーションにもたらしています。MapRはフォーチュン100企業やWeb 2.0企業を中心として、金融サービス、小売業、メディア、医療機関、製造業、通信、政府機関等、500社以上のお客様にご利用いただいております。また、アマゾン、シスコ、グーグル、HPは、MapRの強力なエコシステムパートナーです。投資家には、Lightspeed Venture Partners、Mayfield Fund、NEA、Redpoint Venturesが名を連ねています。MapRは米国カリフォルニア州に本社を置き、東京都千代田区に日本法人を構えています。
ホームページ: (リンク »)
Facebook : (リンク »)
Twitter : (リンク »)
【お客様からのお問い合せ先】
マップアール・テクノロジーズ株式会社 営業部
Tel: 03-5288-5370 Email: sales-jp@mapr.com
お問い合わせにつきましては発表元企業までお願いいたします。