「今後、音声や画像などの非構造化データが急増する」--米Isilon Systems社長兼CEO

日川佳三(編集部) 2005年09月14日 23時36分

  • このエントリーをはてなブックマークに追加

 米Isilon Systemsは、音声や画像などの非構造化データを格納する用途に適したストレージ「Isilon IQ」を開発するベンダーである。2005年9月14日、社長兼CEO(最高経営責任者)のスティーブ・ゴールドマン(Steve Goldman)氏が来日し、企業が扱うデータとストレージ市場のトレンドの変化を語った。

Isilon IQ

 Isilon IQは、分散型ファイル・システム「Isilon OneFS」を搭載するPCベースのファイル・サーバ・アプライアンス(NAS:Network Attached Storage)である。個々のNASをノードと見なし、ノード同士をサーバ間インターコネクト経由で接続してクラスタを構成し、論理的な巨大なネットワーク・ファイル・システムを実現する。

 国内の販売代理店は東京エレクトロン。容量1.92Tバイトの「Isilon IQ 1920」を3ノード構成で使う場合の参考価格は1200万円である。

--ストレージを取り巻く状況と、米Isilon Systemsの特色について教えて欲しい。

 米Isilon Systemsの存在理由はまさに、画像や音声、映像といったデジタル・コンテンツが爆発的に増えているという世の中の情勢にある。米Yankee Groupの調査によれば、3年前にはデータ全体の5%以下でしかなかったデジタル・コンテンツは、現在では15%強に達しており、2007年には全体の3分の1強にまで成長する。

 ストレージに格納するデータのトレンドは2つある。(1)1つは、紙から画像データへの変換などデジタル・コンテンツの利用が増えているという点だ。企業のデータは従来、テキスト・データが主だったが、現在では画像などを扱うようになってきている。(2)もう1つは、ファイル・サイズの量が増えているということだ。

 ファイル・サイズの成長は早い。米国のスポーツ雑誌『Sports Illustrated』が2004年に扱った写真データのサイズを例に挙げよう。2004年のアテネ五輪の時に1枚10Mバイトだった写真データが、2005年初頭に実施したNFL(National Football League)のチャンピオンを決めるイベント「Super Bowl」の時には20Mバイトに倍加しているという事実だ。

--デジタル・コンテンツに特化したストレージとはどういう条件を備えたものなのか。

 デジタル・コンテンツを格納するための技術は独特だ。従来型のストレージはデータベースなどの構造化データの格納に適しているが、デジタル・コンテンツのような非構造化データの格納には向かない。

 データベースで管理する従来のデータは小さく、ランダム・アクセスを伴う。一方で、デジタル・コンテンツは大きく、連続読み出しデータとしてアクセスする。我々のストレージは後者、すなわち非構造化データの格納に特化している。

--非構造化データの格納に適したストレージとは何か。

 クラスタード・ストレージ(クラスタ化したNAS)だ。SAN(Storage Area Network)とも一般的なNAS製品とも異なる新たなカテゴリだ。クラスタを構成する1台のNASは1台の独立したNASとして使える。加えて、OneFSと呼ぶ分散型ファイル・システムのソフトを用い、複数のNASをクラスタ接続して論理的な1台の巨大なNASを作ることができる。

 非構造化データの格納に対する従来型のストレージ・ベンダーの回答は、1台のNASヘッドの背後にストレージを接続するというアプローチだ。ストレージの集合体をNASに見立てることが可能だが、このアーキテクチャでは拡張性も可用性も乏しく、NASとしての性能もボトルネックが発生してしまう。

 容量も異なる。我々のIsilon IQでは、単一のファイル・システムの最大論理容量が168Tバイトに達する。これは従来型のストレージ・ベンダーの製品と比べて10倍の容量だ。Isilon IQを使った米Eastman Kodakの写真格納サービスの事例では、2000万人のユーザーが10億枚の写真データを格納している。

--ファイル・サーバをクラスタ化するという発想はユニークだ。サーバ機のクラスタ化の利点をストレージで利用できる。

 クラスタの利点は、サーバ・クラスタでもストレージ・クラスタでも共通だ。サーバ・クラスタと同様の負荷分散と可用性の向上を実現できる。負荷分散は、サーバ機と同様、単純にノードを追加すればよい。分散ファイル・システムであるOneFSが、複数のノードにまたがる倫理ファイル・システムを実現する。

 可用性という意味では、サーバ機のように一時的なデータをメモリ上に保持していればよいわけではないが、ノード同士をRAID構成で利用できるようにしている。パリティに割くディスク容量をRAID-5の2倍にした構成の、RAID-6と呼ぶ構成だ。これにより、同時に2つのノードに障害が発生してもデータを復旧できる。

--ノード間接続のためのインターコネクト技術にInfiniBandを採用した理由は何か。

 InfiniBand接続機構は2005年4月に出荷した。米Topspin Communicationsの製品を使っている。2005年4月以前は、ノード(NAS)同士の接続、つまりインターコネクト用の専用ネットワークには、ギガビットイーサネットを使っていた。InfiniBandはギガビットイーサネットと比べて遅延が1桁小さくて済む上、帯域も1桁大きい。InfiniBandを出荷してから、顧客の多くがInfiniBandを採用している。

 確かにInfiniBandはギガビットイーサネットと比べて高価だ。InfiniBandのような専用ネットワークからギガビットイーサネットのような汎用ネットワークに代わるという見方もある。だがInfiniBandの性能は高い。汎用的なネットワーク・アクセスには向かないが、サーバ間インターコネクトにはInfiniBandの方が性能面で向いている。

  • このエントリーをはてなブックマークに追加

SpecialPR

連載

CIO
藤本恭史「もっと気楽にFinTech」
Fintechの正体
内山悟志「IT部門はどこに向かうのか」
情報通信技術の新しい使い方
米ZDNet編集長Larryの独り言
谷川耕一「エンプラITならこれは知っとけ」
田中克己「2020年のIT企業」
大木豊成「Apple法人ユースの取説」
デジタル未来からの手紙
モノのインターネットの衝撃
松岡功「一言もの申す」
三国大洋のスクラップブック
大河原克行のエンプラ徒然
今週の明言
アナリストの視点
コミュニケーション
情報系システム最適化
モバイル
通信のゆくえを追う
スマートデバイス戦略
セキュリティ
ネットワークセキュリティ
セキュリティの論点
スペシャル
de:code
Sapphire Now
VMworld
HPE Discover
Oracle OpenWorld
Dell World
AWS re:Invent
PTC LiveWorx
デプロイ王子のテクノロジ解説!
古賀政純「Dockerがもたらすビジネス変革」
誰もが開発者になる時代 ~業務システム開発の現場を行く~
さとうなおきの「週刊Azureなう」
より賢く活用するためのOSS最新動向
「Windows 10」法人導入の手引き
北川裕康「データアナリティクスの勘所」
Windows Server 2003サポート終了へ秒読み
米株式動向
Windows Server 2003サポート終了
実践ビッグデータ
中国ビジネス四方山話
日本株展望
ベトナムでビジネス
アジアのIT
10の事情
エンタープライズトレンド
クラウドと仮想化