米Isilon Systemsは、音声や画像などの非構造化データを格納する用途に適したストレージ「Isilon IQ」を開発するベンダーである。2005年9月14日、社長兼CEO(最高経営責任者)のスティーブ・ゴールドマン(Steve Goldman)氏が来日し、企業が扱うデータとストレージ市場のトレンドの変化を語った。
Isilon IQは、分散型ファイル・システム「Isilon OneFS」を搭載するPCベースのファイル・サーバ・アプライアンス(NAS:Network Attached Storage)である。個々のNASをノードと見なし、ノード同士をサーバ間インターコネクト経由で接続してクラスタを構成し、論理的な巨大なネットワーク・ファイル・システムを実現する。
国内の販売代理店は東京エレクトロン。容量1.92Tバイトの「Isilon IQ 1920」を3ノード構成で使う場合の参考価格は1200万円である。
--ストレージを取り巻く状況と、米Isilon Systemsの特色について教えて欲しい。
米Isilon Systemsの存在理由はまさに、画像や音声、映像といったデジタル・コンテンツが爆発的に増えているという世の中の情勢にある。米Yankee Groupの調査によれば、3年前にはデータ全体の5%以下でしかなかったデジタル・コンテンツは、現在では15%強に達しており、2007年には全体の3分の1強にまで成長する。
ストレージに格納するデータのトレンドは2つある。(1)1つは、紙から画像データへの変換などデジタル・コンテンツの利用が増えているという点だ。企業のデータは従来、テキスト・データが主だったが、現在では画像などを扱うようになってきている。(2)もう1つは、ファイル・サイズの量が増えているということだ。
ファイル・サイズの成長は早い。米国のスポーツ雑誌『Sports Illustrated』が2004年に扱った写真データのサイズを例に挙げよう。2004年のアテネ五輪の時に1枚10Mバイトだった写真データが、2005年初頭に実施したNFL(National Football League)のチャンピオンを決めるイベント「Super Bowl」の時には20Mバイトに倍加しているという事実だ。
--デジタル・コンテンツに特化したストレージとはどういう条件を備えたものなのか。
デジタル・コンテンツを格納するための技術は独特だ。従来型のストレージはデータベースなどの構造化データの格納に適しているが、デジタル・コンテンツのような非構造化データの格納には向かない。
データベースで管理する従来のデータは小さく、ランダム・アクセスを伴う。一方で、デジタル・コンテンツは大きく、連続読み出しデータとしてアクセスする。我々のストレージは後者、すなわち非構造化データの格納に特化している。
--非構造化データの格納に適したストレージとは何か。
クラスタード・ストレージ(クラスタ化したNAS)だ。SAN(Storage Area Network)とも一般的なNAS製品とも異なる新たなカテゴリだ。クラスタを構成する1台のNASは1台の独立したNASとして使える。加えて、OneFSと呼ぶ分散型ファイル・システムのソフトを用い、複数のNASをクラスタ接続して論理的な1台の巨大なNASを作ることができる。
非構造化データの格納に対する従来型のストレージ・ベンダーの回答は、1台のNASヘッドの背後にストレージを接続するというアプローチだ。ストレージの集合体をNASに見立てることが可能だが、このアーキテクチャでは拡張性も可用性も乏しく、NASとしての性能もボトルネックが発生してしまう。
容量も異なる。我々のIsilon IQでは、単一のファイル・システムの最大論理容量が168Tバイトに達する。これは従来型のストレージ・ベンダーの製品と比べて10倍の容量だ。Isilon IQを使った米Eastman Kodakの写真格納サービスの事例では、2000万人のユーザーが10億枚の写真データを格納している。
--ファイル・サーバをクラスタ化するという発想はユニークだ。サーバ機のクラスタ化の利点をストレージで利用できる。
クラスタの利点は、サーバ・クラスタでもストレージ・クラスタでも共通だ。サーバ・クラスタと同様の負荷分散と可用性の向上を実現できる。負荷分散は、サーバ機と同様、単純にノードを追加すればよい。分散ファイル・システムであるOneFSが、複数のノードにまたがる倫理ファイル・システムを実現する。
可用性という意味では、サーバ機のように一時的なデータをメモリ上に保持していればよいわけではないが、ノード同士をRAID構成で利用できるようにしている。パリティに割くディスク容量をRAID-5の2倍にした構成の、RAID-6と呼ぶ構成だ。これにより、同時に2つのノードに障害が発生してもデータを復旧できる。
--ノード間接続のためのインターコネクト技術にInfiniBandを採用した理由は何か。
InfiniBand接続機構は2005年4月に出荷した。米Topspin Communicationsの製品を使っている。2005年4月以前は、ノード(NAS)同士の接続、つまりインターコネクト用の専用ネットワークには、ギガビットイーサネットを使っていた。InfiniBandはギガビットイーサネットと比べて遅延が1桁小さくて済む上、帯域も1桁大きい。InfiniBandを出荷してから、顧客の多くがInfiniBandを採用している。
確かにInfiniBandはギガビットイーサネットと比べて高価だ。InfiniBandのような専用ネットワークからギガビットイーサネットのような汎用ネットワークに代わるという見方もある。だがInfiniBandの性能は高い。汎用的なネットワーク・アクセスには向かないが、サーバ間インターコネクトにはInfiniBandの方が性能面で向いている。