時代はポストRDBへ--NoSQL徹底研究:2015年はNoSQL元年、今なぜ必要なのか

原沢滋 (DataStax)

2015-03-02 15:30

 企業の中で最も重要な資産の一つである“データ”の多くは1990年代以降、多くがリレーショナルデータベース(RDB)で管理されてきました。ところが最近のビッグデータの潮流の中で、インターネットやモバイル端末を利用する“モノのインターネット(Internet of Things:IoT)”のデータを取り扱う企業やウェブ系、一般企業で従来から利用しているRDBではなく、NoSQLを利用する企業が増えてきています。NoSQLが話題になるようになって数年経ちますが、今なぜNoSQLなのか、日本で利用者が増加しているオープンソースの主なNoSQL製品を研究しながら探っていきたいと思います。

 今回、この企画をするにあたって、各ベンダーや各方面の専門家が賛同し協力してくれています。製品の特徴、強み、そして、どの分野に利用するのがよいのか、最も重要なこととしてどのような利用に向いているのか、また商用版が存在する場合にはその違いについてシリーズで説明して頂きます。

  • 第1回:NoSQL徹底研究
  • 第2回:Apache HBase(MapR Technologies)
  • 第3回:MongoDB(野村総合研究所)
  • 第4回:Riak(Basho Japan)
  • 第5回:Couchbase(Couchbase)
  • 第6回:Redis(アイレット)
  • 第7回:Apache Cassandra(DataStax)
  • 第8回:Neo4j(Neo4jユーザグループ)
  • 第9回:まとめ

NoSQLの主なカテゴリ

 NoSQLはさまざま種類の膨大なデータ量を高速かつ動的に整理し分析することを可能にする、非リレーショナルな分散データベースシステムです。知られているだけでも100を超えるさまざまな製品がありますが、大きく分けて4種類のカテゴリに分けられます。

 各製品にはそれぞれに特徴があり、向き不向きがありますので、製品選定の際には、特徴の違いを理解しておくことがとても重要になります。今回のシリーズで紹介する7つについても、どのカテゴリに分類されるか覚えておいてください

  • キーバリュー型:Riak、Redis
    多くのNoSQLがKey(キー)を持っていることから、基本はキーバリューに属しているとも言えます。データの管理、アクセスはキーに対して行い、そのキーに対してバリューが存在します。高速なパフォーマンスとデータ分散が行えるため拡張性に優れています。データの読込がRDBと比較して高速であることが特徴としてあります
  • ワイドカラムストア型: Apache Cassandra、Apache HBase
    列指向とも言われることもありますが、データはRDBのようにレコード(行)で管理されます。アクセスはキーバリューと同じようにキーを使用して列単位になります。列に対して数億件というデータの追加が可能で、RDBより柔軟性とパフォーマンス、拡張性で優れていていると言われ、データの書き込みが高速であることが特徴です
  • ドキュメント型:Couchebase、MongoDB
    キーに対してバリューではなく、より複雑なドキュメントとしてデータを格納します。JSONといったデータ記述書式で取り扱うことが可能で、半構造化データの取り扱いを得意とします。特に、複雑なデータ構造を扱うアプリケーションにおいては、生産性高く柔軟に開発できるメリットがあります
  • グラフ型:Neo4j
    グラフ理論に基づき、相互に結びついた要素で構成され、それぞれの間に任意の数の結びつきのあるデータ同士の関係をグラフとして表すのが適切なデータを対象とするように設計されます。グラフデータベースは、従来のRDBでは不可能だった形でデータの関係をモデル化し探索するのに役立つように作られており、データをグラフ型で格納した場合、RDBと比較して高速に横断検索をすることが可能です

 以下の表は、NoSQLデータベースを評価する際に考慮すべきいくつかの重要な特性を示します(表1)。

表1:NoSQLを評価する際に考慮すべき特性(筆者作成)
データモデルパフォーマンススケーラビリティ柔軟性複雑さ機能性
キーバリューなしさまざま(なし)
ワイドカラムストア最小限
ドキュメントさまざま(高)さまざま(低)
グラフさまざまさまざまグラフ理論

NoSQLへの動き

 データベースは1959年にW.C.McGee氏による論文で初めてその言葉が定義されたと言われています。1960年代に入るといくつかデータベースが発表され、1970年代から1990年代頃までは、メインフレームの全盛期時代がありました。大型コンピュータによって計算処理の高速化、記憶、記録装置が発展した、この時代のデータベースは階層型データベース(HDB)やネットワークデータベース(NDB)といったものです。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    セキュリティ担当者に贈る、従業員のリテラシーが測れる「情報セキュリティ理解度チェックテスト」

  2. クラウドコンピューティング

    生成 AI の真価を引き出すアプリケーション戦略--ユースケースから導くアプローチ

  3. セキュリティ

    サイバー攻撃の“大規模感染”、調査でみえた2024年の脅威動向と課題解決策

  4. セキュリティ

    従業員のセキュリティ教育の成功に役立つ「従業員教育ToDoリスト」10ステップ

  5. セキュリティ

    IoTデバイスや重要インフラを標的としたサイバー攻撃が増加、2023年下半期グローバル脅威レポート

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]