「今後、音声や画像などの非構造化データが急増する」--米Isilon Systems社長兼CEO

日川佳三(編集部)

2005-09-14 23:36

 米Isilon Systemsは、音声や画像などの非構造化データを格納する用途に適したストレージ「Isilon IQ」を開発するベンダーである。2005年9月14日、社長兼CEO(最高経営責任者)のスティーブ・ゴールドマン(Steve Goldman)氏が来日し、企業が扱うデータとストレージ市場のトレンドの変化を語った。

Isilon IQ

 Isilon IQは、分散型ファイル・システム「Isilon OneFS」を搭載するPCベースのファイル・サーバ・アプライアンス(NAS:Network Attached Storage)である。個々のNASをノードと見なし、ノード同士をサーバ間インターコネクト経由で接続してクラスタを構成し、論理的な巨大なネットワーク・ファイル・システムを実現する。

 国内の販売代理店は東京エレクトロン。容量1.92Tバイトの「Isilon IQ 1920」を3ノード構成で使う場合の参考価格は1200万円である。

--ストレージを取り巻く状況と、米Isilon Systemsの特色について教えて欲しい。

 米Isilon Systemsの存在理由はまさに、画像や音声、映像といったデジタル・コンテンツが爆発的に増えているという世の中の情勢にある。米Yankee Groupの調査によれば、3年前にはデータ全体の5%以下でしかなかったデジタル・コンテンツは、現在では15%強に達しており、2007年には全体の3分の1強にまで成長する。

 ストレージに格納するデータのトレンドは2つある。(1)1つは、紙から画像データへの変換などデジタル・コンテンツの利用が増えているという点だ。企業のデータは従来、テキスト・データが主だったが、現在では画像などを扱うようになってきている。(2)もう1つは、ファイル・サイズの量が増えているということだ。

 ファイル・サイズの成長は早い。米国のスポーツ雑誌『Sports Illustrated』が2004年に扱った写真データのサイズを例に挙げよう。2004年のアテネ五輪の時に1枚10Mバイトだった写真データが、2005年初頭に実施したNFL(National Football League)のチャンピオンを決めるイベント「Super Bowl」の時には20Mバイトに倍加しているという事実だ。

--デジタル・コンテンツに特化したストレージとはどういう条件を備えたものなのか。

 デジタル・コンテンツを格納するための技術は独特だ。従来型のストレージはデータベースなどの構造化データの格納に適しているが、デジタル・コンテンツのような非構造化データの格納には向かない。

 データベースで管理する従来のデータは小さく、ランダム・アクセスを伴う。一方で、デジタル・コンテンツは大きく、連続読み出しデータとしてアクセスする。我々のストレージは後者、すなわち非構造化データの格納に特化している。

--非構造化データの格納に適したストレージとは何か。

 クラスタード・ストレージ(クラスタ化したNAS)だ。SAN(Storage Area Network)とも一般的なNAS製品とも異なる新たなカテゴリだ。クラスタを構成する1台のNASは1台の独立したNASとして使える。加えて、OneFSと呼ぶ分散型ファイル・システムのソフトを用い、複数のNASをクラスタ接続して論理的な1台の巨大なNASを作ることができる。

 非構造化データの格納に対する従来型のストレージ・ベンダーの回答は、1台のNASヘッドの背後にストレージを接続するというアプローチだ。ストレージの集合体をNASに見立てることが可能だが、このアーキテクチャでは拡張性も可用性も乏しく、NASとしての性能もボトルネックが発生してしまう。

 容量も異なる。我々のIsilon IQでは、単一のファイル・システムの最大論理容量が168Tバイトに達する。これは従来型のストレージ・ベンダーの製品と比べて10倍の容量だ。Isilon IQを使った米Eastman Kodakの写真格納サービスの事例では、2000万人のユーザーが10億枚の写真データを格納している。

--ファイル・サーバをクラスタ化するという発想はユニークだ。サーバ機のクラスタ化の利点をストレージで利用できる。

 クラスタの利点は、サーバ・クラスタでもストレージ・クラスタでも共通だ。サーバ・クラスタと同様の負荷分散と可用性の向上を実現できる。負荷分散は、サーバ機と同様、単純にノードを追加すればよい。分散ファイル・システムであるOneFSが、複数のノードにまたがる倫理ファイル・システムを実現する。

 可用性という意味では、サーバ機のように一時的なデータをメモリ上に保持していればよいわけではないが、ノード同士をRAID構成で利用できるようにしている。パリティに割くディスク容量をRAID-5の2倍にした構成の、RAID-6と呼ぶ構成だ。これにより、同時に2つのノードに障害が発生してもデータを復旧できる。

--ノード間接続のためのインターコネクト技術にInfiniBandを採用した理由は何か。

 InfiniBand接続機構は2005年4月に出荷した。米Topspin Communicationsの製品を使っている。2005年4月以前は、ノード(NAS)同士の接続、つまりインターコネクト用の専用ネットワークには、ギガビットイーサネットを使っていた。InfiniBandはギガビットイーサネットと比べて遅延が1桁小さくて済む上、帯域も1桁大きい。InfiniBandを出荷してから、顧客の多くがInfiniBandを採用している。

 確かにInfiniBandはギガビットイーサネットと比べて高価だ。InfiniBandのような専用ネットワークからギガビットイーサネットのような汎用ネットワークに代わるという見方もある。だがInfiniBandの性能は高い。汎用的なネットワーク・アクセスには向かないが、サーバ間インターコネクトにはInfiniBandの方が性能面で向いている。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

注目している大規模言語モデル(LLM)を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]