URL: (リンク ») )は、EMCコーポレーションが、2011年9月21日に、Apache Hadoopの統合テストを常時実行できる「Greenplum Analytics Workbench(グリーンプラム・アナリティクス・ワークベンチ)」を構築し、オープンソース・コミュニティに開放したことを発表しました。これは、1,000台を超えるノードおよび世界最先端のソフトウェアとハードウェアにより構築されており、Apache Hadoopの技術革新の促進を目的としたものです。大規模なテスト環境の提供により、開発者は、より広範な検証を行えるため、企業はオープンソースの新しい製品リリースでも、安心して本番環境に導入できるようになります。
Apache Hadoopは、非構造化のビッグデータの分析に適したソリューションとして急速に注目されています。変わり続けるビジネス環境で、ビジネス・チャンスを探し続ける企業は現在、ビッグデータ分析に競争優位性を見出しています。実際、米調査会社TDWI(The Data Warehousing Institute)の2011年の調査によると、34%の企業がすでにビッグデータ分析を行っており、その数は伸び続けています。Hadoopをベースにした大規模な構造化および非構造化データのバッチ処理が、汎用ハードウェア上で実行可能になったことで、分析の世界は大きく変化しました。非構造化データや機械が生成したデータに含まれる情報を抽出することで、より良い判断ができるようになり、結果として、収益やサービスの向上、コストの削減などが可能になります。
Hadoopの発展はオープンソース開発者の貢献にかかっていますが、Apache Hadoopコミュニティでは、新たな製品リリースの検証に必要なリソースを用意できないという問題を常に抱えてきました。
拡張性の検証に必要な大規模なクラスタがないため、Apacheコミュニティ、または企業のユーザも、Hadoopユーザ・コミュニティによる大規模検証の支援を待つしかありませんでした。しかし、そのような支援はまれで、新たに製品リリースが行われても、企業が使えるように安定させるまでには、かなりの時間が費やされてきました。
意欲的に継続的な製品リリースが行われている中、これまでなかったテスト環境を提供するという形で
Hadoopオープンソース・コミュニティに貢献できることは、EMCにとって非常に有意義なことです。
この環境により、Hadoopの発展スピードを促進するために必要な、迅速なバグの検知、新リリースの安定化、ハードウェアの最適設定などが行えるようになります。EMCは、テスト結果をApache SoftwareFoundationとオープンソース・コミュティに提供していく予定です。
また、テストは、Apache Hadoopプロジェクトと協力して実施する予定です。
「Greenplum Analytics Workbench」は、EMCと下記のソフトウェア企業およびハードウェア企業の協力により実現しました。
・ Intel
・ Mellanox Technologies
・ Micron
・ Seagate
・ Super Micro
・ Switch
・ VMware
テスト用クラスタは、ハードウェア・ノードで1,000以上、仮想マシンでは10,000台以上のノードから成り、24PBの物理ストレージを備えています。なお、24PBというデータ量は、有史以来残された全文書のほぼ半分に匹敵します。
■本件に関するコメント:
Dhruba Borthakur氏 (Hadoopプロジェクト・マネージメント委員会のメンバー)
「Apache Hadoopのリリースをペタバイト規模のクラスタで検証するというEMCとEMCのパートナー企業の試みは、Apache Hadoopコミュニティへの大きな貢献です。
継続的な統合テストが行えることで、世界最高の非構造データ分析ソフトウェアは、より良く、より速くなり、企業や組織は自分たちのデータからより多くの情報を得られるようになるでしょう」。
Michael Stack氏 (Stumble Uponエンジニア、Hadoopプロジェクト・マネージメント委員会のメンバー)「EMCの1,000ノード・クラスタは、大規模環境でのHadoopの検証という、これまでできなかったことを可能にしてくれます。早く試してみたいと思っています」。
Konstantin Shvachko氏 ( eBay、Hadoopプロジェクト・マネージメント委員会のメンバー)「現在のApache Hadoopは、Hadoopのリリースを大規模環境で検証するための標準ツールを必要としています。EMCが提供する1,000ノードのテスト環境は、ビッグデータ分析にとって極めて重要な存在であるApache Hadoopの開発を促進し、ソフトウェア内部の革新を進め、Hadoopの導入を大きく推進していくでしょう。なかでも、EMCがテスト結果をオープンソース・コミュニティに還元することを大変うれしく思っています」。
David Tuhy氏(Intelストレージ・グループ・ジェネラル・マネージャ)「Intelは、史上最大のHadoopテスト環境の構築に参加できることを大変うれしく思っています。
ビッグデータ分析や大量に作られる非構造化データの活用ができれば、業界全体を変えることができるかもしれません。最新のプロセッサーIntel Xeon 5600シリーズを使い、大規模環境でのビッグデータ分析やApache Hadoopの可能性を最大限に引き出すための処理能力を提供していきます。このクラスタ上で行われる開発やテストから得られる情報は、Intelを含むオープンコミュニティ全体にとってのメリットとなるでしょう」。
Luke Lonergan氏(EMC Greenplum部門最高技術責任者)
「我々は、Greenplum Analytics Workbenchを構築したハードウェアおよびソフトウェアのエリート・グループの一員になれたことを大変うれしく思います。1,000ノードを超えるテスト環境は、それ自体が一つの偉業です。しかし、もっと重要なことは、このテスト環境がオープンソース・コミュニティに開放されるということで、我々も大変うれしく思っています。これで、企業も安心してApache Hadoopを本番環境に導入することができるようになり、ビッグデータ分析のメリットを享受できるようになります」。
当資料は、2011年9月21日に米国で発表されたニュース・リリースの抄訳です。
米国リリース原文: (リンク »)
# # #
■EMCジャパン株式会社について
EMCジャパンは、情報インフラの卓越したテクノロジーとソリューションの提供を通して、日本のお客様の情報インフラの課題解決をご支援し、あらゆる規模のお客様のビジネスの継続と成長、さらにビジネス価値の創造に貢献致します。 (リンク »)
本件に関するお問い合わせ先
EMCジャパン株式会社 マーケティング本部 マーケティング・コミュニケーション部
広報マネージャ 武村綾
Tel: 03-5308-8888 (代表)/ 03-5308-8867(直通) E-mail: japanpr@emc.com
EMCジャパン株式会社 マーケティング本部 マーケティング・コミュニケーション部
部長 笛田理枝子
Tel: 03-5308-8888 (代表)/ 03-5308-8174 (直通) E-mail: japanpr@emc.com
EMC、EMC2、Greenplumは、米国EMCコーポレーションの登録商標または商標です。これらの商標は、
日本または諸外国で商標登録等により、適用法令で守られている場合があります。その他の製品の
登録商標および商標は、それぞれの会社に帰属します。
お問い合わせにつきましては発表元企業までお願いいたします。