ビッグデータとクラウド・ストレージ」 連載 第十二回
トレンド編6: ストレージ市場の俯瞰とその新潮流 - 空気を読まない「破壊(disrupt)」
エノテック・コンサルティング代表
海部美知
この連載、続きものとしてはいったん今回にて終了、今後は不定期の掲載となる。連載の最後として、少々まとめ的に、ストレージ市場を俯瞰的に見ておくことにしよう。
◆ サーバー人とストレージ人の顔ぶれ
連載ではクラウド・ストレージについて主に書いてきたが、エンタープライズのインフラではまだまだ、自前で機器を購入して運用するケースのほうが多い。こうした機器の市場では、連載第七回 (»リンク) に書いたように「サーバー人」と「ストレージ人」が別々の顔ぶれだが、いずれも大きなベンダーがしっかり市場を押さえている。
IDCの最近の発表 (»リンク) によると、企業向けサーバーのベンダー上位は、IBMがシェア37%で圧倒的トップ、これにHP、デル、オラクル、富士通が続き、上位3社で市場の75%を占める。
同じくIDCの調査 (»リンク) で、企業向けストレージ製品の上位は、EMCが24%でやはり圧倒的トップであり、これにIBM、HP、デル、ネットアップが続き、上位3社のシェアが65%だ。
こうしたストレージ機器は、堅牢・高価・高マージンというのが相場。この市場を、空気を読まないアマゾンが低マージンの「クラウド・サービス」で破壊(disrupt)しようとしていることになる。
◆ 大容量化・高速化の流れ
といっても、アマゾンは単に同じもののマージンを削って安値攻勢をしているのではなく、ワケあって安い。というより、重視する要素が異なる、別物といったほうがよく、ストレージのニーズによって、どれを選ぶべきかは異なる。
InfoWorld掲載のストレージの新技術潮流についてまとめた記事 (»リンク) では、いくつかの企業の事例とそれに合う技術の進展状況が挙げられている。
例えば、HD監視カメラの映像データが増えすぎて悲鳴をあげている物流会社のケースでは、コストを抑えてひたすら物量を溜め込めるシステムが欲しい。ただし、アクセス速度も可用性もあまり重要ではない。こうした用途向けには、ディスクの材料や保存方式の技術革新により、将来的には現在主流となっている方式の5~6倍程度まで容量をあげる技術がいくつか開発されている。また、ソリッドステートドライブ(SSD)では、容量そのものを増やすだけでなく、オーバーヘッドを減らすことで実質的に容量をあげることも行われている。
また、この場合は連載第九回 (»リンク) で述べた重複排除(de-dupe)とデータ圧縮によって、保存データを減らす機能も効果的だ。特に、データを保存する前に重複排除する「in-line de-dupe」を使えば、いったん保存してから圧縮するよりも最初から容量が少なくて済むため、使える容量が5~10倍増えるのと同じ効果がある。重複排除はストレージ製品には不可欠な機能となりつつある。
一方、大量のデータを高速で処理する必要のある大学の研究設備では、アクセス速度を重視して、NAS機器をより高性能のものにアップグレードした。ただし、扱っているのはトランザクション・データではないので、データの書き換えはほとんど起こらず、書き込みの可用性は問題にならない。
◆ クラウド・ストレージはどう違うのか
これに対し、企業のマーケティング情報管理をSaaS方式で提供するオンライン・サービスでは、従来型の高性能システムから、安価なコモディティのハードウェアに分散管理能力にすぐれたソフトウェアを載せる方式で、コスト削減と速度・可用性・スケーラビリティの向上とディザスター・リカバリーを同時に実現したという。
この企業のケースでは、デルの安価なハードとNOSQLのCassandraを使っている。先刻のde-dupeとは逆に、データセットの複数のコピーをネットワーク内の別の場所に保管する。「書き込みの可用性」を優先して、どのコピーにもいつでも書き込みができるようにし、コピー同士の同期は後で解決する。この企業の業務ニーズからすると、それほどの頻度でデータが書き換えられるわけではないので、この間数ミリ秒はデータが完全にアップデートされていなくても問題がない。(ただし、金融取引システムなどのように、非常に高頻度でデータ書き換えが起こる場合にはこの方式は使えない。)
もともとハードウェアの故障が多いことを想定しているため、ディザスター・リカバリーの仕組みが内在されている。複数コピーの保存・管理により、一部が壊れたり復旧したりしてもすぐに元に戻るのだ。災害でなくても、わざとハードを増やしたり減らしたりする作業も同じ仕組みで簡単にできるので、急激なデータの増減に容易に対応できるスケーラビリティが実現できる。
え・・あれ?この仕組みはどこかで聞いたことがあるような・・と思われたかもしれない。そう、これはアマゾンと同じ考え方、つまり「クラウド・ストレージ」のコンセプトだ。使うソフトにより多少の違いがあるが、なにしろ「ソフトによる分散管理」と、それに伴う「スケールアウト能力」が、連載第二回 (»リンク) で紹介した「クラウド・ストレージ」の最重要ポイントだ。
このオンラインサービス企業の場合は、自前でこのシステムを構築した「プライベート・クラウド」であるが、アマゾンはこれらの特徴を活かして、もとは自社用に作ったシステムを、マルチテナントで外部企業にも貸し出しているというわけだ。
これらの特徴のうち、「高速」という部分を外せば、さらに安価なアーカイブ向けのサービスが可能となる。昨年11月に発表された、データの取り出しに3~5時間かかるアマゾンのGlacierでは、なんとギガバイト当たり月額1セントである。アクセス時間もテープ並だが、料金もテープと十分競争できるレベルと言われている。
アマゾンが「ワケあって安い」というのは、こういった背景がある。従来型の企業向けストレージ製品をデータセンターに置いてネットでつないだとしても、それは「ホスティング」であって、上記のような「クラウド」とは違う。
◆ アマゾンと対抗陣営たち
このアマゾン・ウェブ・サービス(AWS)のS3が、クラウド・ストレージ市場の60%のシェアを持っており、事実上の標準となっていることは何度も述べたとおりだ。しかし当然、冒頭に挙げたような大手ベンダーは、空気を読まないアマゾンを面白くないと思うので、なんとか対抗しようという動きが見られる。
クラウド・ストレージにはCDMIという国際標準規格が採択されているが、このメンバーはEMCなどの既存ストレージ・ベンダーであり、アマゾンははいっていない。
また、第五回 (»リンク) で報告したOpenStackやCloudStackなどのオープンソース勢力も頑張っている。NASAを源流とするOpenStack勢では、今年の1月にIBMが自社サービスをOpenStackで構築すると発表している (»リンク) 。大手各社は、いずれも自社製品のAPIによるエコシステム構築を目指すはずだ。
このように、陣取り合戦は激化しているが、それでもS3が強いという事実は無視できない。第十回 (»リンク) で話されているように、一部をS3で、別の一部はプライベート・クラウドで、という「ハイブリッドクラウド」や、すでにS3で作ったシステムを移し替える場合、S3と他のクラウドをつなげて使う場合など、いろいろな場面が想定できる。その場合に、S3に対応していなければ、つなげるためにアプリケーションに手を加えたり、ミドルウェアで差分を吸収したり、ユーザー側のインターフェースが面倒になったり、などといった余計な手間がかかる。
このため、OpenStackなどの製品でも、「S3との互換性」をうたっているケースが大半だ。現代の国際社会と同じで、相互依存関係が強くなり、たとえ相手を面白くないと思っても、なんとか共存していくのが得策なのだ。
シリーズ・スポンサーのクラウディアンは、S3陣営の一角でもあり、従来型の企業自前の設備と、アマゾン型のパブリック・クラウドとの間のギャップを埋める存在である。前述の例にあげたオンライン・マーケティング管理企業のように、自前でスケーラブルなプライベート・クラウドを構築できればよいのだが、一般企業ではなかなか難しいので、その場合はクラウディアンのような、新しいタイプのクラウド・ベンダーを活用すればよい。
ストレージ業界の「破壊(disrupt)」とは、単なる価格破壊ではない。種々の企業のそれぞれのニーズに合わせて、有効な選択肢が増えるということだ。データ量の爆発的な増加や、データ分野の新しいビジネスモデルの登場はますます加速していくと予想される中、企業ユーザーの間でもクラウド・ストレージの重要性はますます高まっていくだろう。
◆◇◆ このブログはクラウディアンのブログでもご覧になれます。 (»リンク) ◆◇◆
- 海部 美知(かいふ・みち)
- 海部 美知エノテック・コンサルティングCEO(最高経営責任者)。ホンダを経て1989年NTT入社。米国の現地法人で事業開発を担当。96年米ベンチャー企業のネクストウエーブで携帯電話事業に携わる。98年に独立し、コンサルティング業務を開始。米国と日本の通信・IT(情報技術)・新 技術に関する調査・戦略提案・提携斡旋などを手がける。シリコンバレー在住。子育て中の主婦でもある。
ブログ:Tech Mom from Silicon Valley。
Twitter ID:@MichiKaifu。
著書に『パラダイス鎖国 忘れられた大国・日本』(アスキー
新書)がある。