米Symantecが提供する分散ファイルシステム「Veritas Storage Foundation Cluster File System」が分散並列処理フレームワーク「Apache Hadoop」に対応する。日本法人が8月27日に発表した。日本市場での提供は現在検討中としている。
Storage Foundation Cluster File System向けのアドオンとして「Symantec Enterprise Solution for Hadoop」が提供される。Storage Foundation Cluster File Systemのユーザー企業は無料で導入できる。
Enterprise Solution for HadoopはSymantecと米Hortonworksが提携して提供される。同アドオンは、Hadoop上で稼働するデータ管理基盤ソフトウェア「Hortonworks Data Platform(HDP)1.0」がStorage Foundation Cluster File Systemに対応したことで提供される。
Enterprise Solution for Hadoopのメリットは、既存のインフラを活用して、構造化データと非構造化データの両方を含む最大16Pバイトを処理できるという。ストレージを設置するスペースを最小化することで、コスト削減と手間を回避して、投資を可能な限り抑えてHadoopを運用できるとメリットを説明する。
今回のアドオンを活用すれば、1次ストレージ内でデータを分析できるようになる。Hadoopの処理用フレームワークにデータを移行する必要がないということだ。管理者は対象データを1次ストレージに残したまま分析できることから、データを抽出し、別のインフラに移動して読み込むといった手間がかからなくなる。
Hadoopの環境では、データはノード間に分散され、1台のメタデータサーバだけがデータの保存場所を認識している。そのため、アプリケーションのダウンタイムに至るような性能のボトルネックや単一障害点(Single Point of Failure:SPOF)が発生する可能性がある。
Storage Foundation Cluster File System向けのアドオンとして提供されるEnterprise Solution for Hadoopは、メタデータサーバでのファイルシステムの利用率を高める。同時にクラスタ内に1台以上のノードが稼働している間は、確実に分析アプリケーションが稼働し続ける環境を提供する。
Hadoopファイルシステムは、Storage Foundation Cluster File Systemと置換されるため、クラスタ内の各ノードも同時にデータにアクセスできるようになる。これで性能のボトルネックとSPOFも解消されることを強調している。
Enterprise Solution for HadoopについてSymantecは、「Hadoopの分析機能を既存のストレージ環境と効率的に連動させる。同時にサーバの乱雑な構築、クリティカルアプリケーションの可用性といった課題にも対処できる。ユーザー企業が要求するビッグデータ活用策が、既存のインフラだけで完全に対応できるようになる」と意義を強調している。