富士通は2月27日、分散並列処理フレームワーク「Apache Hadoop」に独自の分散ファイルシステムを搭載したソフトウェア「Interstage Big Data Parallel Processing Server V1.0」を発売した。4月末から出荷する。価格はプロセッサライセンスで60万円から。最新のHadoop 1.0.0をベースに、信頼性と処理性能の向上、導入時間の短縮を実現しており、企業のビッグデータ活用を支援できるとしている。
Interstage Big Data Parallel Processing Serverは、Hadoop標準のファイルシステム「HDFS(Hadoop Distributed File System)」に加え、富士通独自の分散ファイルシステムを搭載することで、ストレージシステムと組み合わせてデータの信頼性を高められるという。Hadoopの単一障害点を、富士通のクラスタ技術を活用したマスタサーバの二重化運用で解消して高い信頼性を実現できるとしている。
独自の分散ファイルシステムを活用することで、Hadoopでのデータ処理で、ストレージシステムに格納したデータに直接アクセスして処理できる。使用するデータをいったんHDFSに転送してから処理するHadoop標準の方式に対して、データ転送が不要になるため、処理時間を大幅に短縮できるという。データを格納するファイルシステムとのインターフェースは、HDFS互換インターフェースに加えて、Linux標準インターフェースをサポートしていることで、バックアップや印刷などの既存ツールをそのまま活用できるとしている。