グローバル規模の情報共有を支える「IBM Spectrum Scale」
次に、「IBM Spectrum Scale」(以下、Spectrum Scale)を紹介しよう。Spectrum Scaleは、サーバーベースの分散型ファイル・ストレージを構築し、スケーラブルかつ高性能なデータとファイルを管理するソリューションだ。ファイル共有のためにNASを導入してきたが、NASの増殖やデータ急増によってデータ管理やガバナンスに課題を抱えているなら、効果的な解決策となるであろう。
この製品は、IBMがスーパーコンピューターの構築で培ってきた分散ファイルシステム「General Parallel File System」(GPFS)を基盤とした製品であり、1998年から提供されている。その特長は、Scaleの名前が示すとおり、ノード数が実質無制限のスケーラビリティで高速な読み書きを実現していること、また、構成の自由度が非常に高いことにある。例えば、Spectrum Scaleをインストールするサーバーは、ベアメタルのサーバーと仮想サーバーが混在していても構わない。各ノードに組み込まれたストレージ・デバイスが、フラッシュやハードディスク、テープあるいはクラウド・サービスなどと異なっていても大丈夫だ。こうした異なる特長を持つストレージを組み合わせることで、ストレージ・コストを最大90%削減することができる。
また、東京の本社と九州の支社に、あるいは日本・東南アジア、アメリカ・ヨーロッパの4拠点にノードを分散するといったマルチサイト構成にも対応できる。マルチサイト構成でも名前空間は1つなので、利用者からは1つのファイルサーバーとして見える。マルチサイト構成ではレイテンシーが気になるが、Spectrum Scaleでは各ノードのメモリ空間を束ねたデータ・グリッドを一次データストア(ローカルキャッシュ)として利用することでI/Oパフォーマンスを最大6倍高速化し、ノードがグローバルに分散していても高速なファイルアクセスを可能にする。
※クリックすると拡大画像が見られます
なお、Spectrum Scaleは、Hadoopのデータストアとして利用することもできる。Hadoopでは専用のHDFS(Hadoop Distributed File System)を利用するのが一般的だが、ストレージ・ノードとは別に中央にコントロール・ノードを必要とするHDFSに対し、Spectrum Scaleはコントロール機能も各ストレージ・ノードに分散するため、対障害性の面で有利である。また、HDFSはMapReduceフレームワークとの連携が不可欠で扱える技術者が限られるが、Spectrum Scaleは普通のファイルサーバーと同じようにファイル操作が行えるので、扱いやすさの面でもメリットがある。
以上、本稿ではSpectrum VirtualizeとSpectrum Scaleの概要を紹介した。IBM Spectrum Storageファミリーのその他の製品については、ダウンロード資料でぜひご確認いただきたい。