時代はポストRDBへ--NoSQL徹底研究:2015年はNoSQL元年、今なぜ必要なのか

原沢滋 (DataStax) 2015年03月02日 15時30分

  • このエントリーをはてなブックマークに追加

 企業の中で最も重要な資産の一つである“データ”の多くは1990年代以降、多くがリレーショナルデータベース(RDB)で管理されてきました。ところが最近のビッグデータの潮流の中で、インターネットやモバイル端末を利用する“モノのインターネット(Internet of Things:IoT)”のデータを取り扱う企業やウェブ系、一般企業で従来から利用しているRDBではなく、NoSQLを利用する企業が増えてきています。NoSQLが話題になるようになって数年経ちますが、今なぜNoSQLなのか、日本で利用者が増加しているオープンソースの主なNoSQL製品を研究しながら探っていきたいと思います。

 今回、この企画をするにあたって、各ベンダーや各方面の専門家が賛同し協力してくれています。製品の特徴、強み、そして、どの分野に利用するのがよいのか、最も重要なこととしてどのような利用に向いているのか、また商用版が存在する場合にはその違いについてシリーズで説明して頂きます。

  • 第1回:NoSQL徹底研究
  • 第2回:Apache HBase(MapR Technologies)
  • 第3回:MongoDB(野村総合研究所)
  • 第4回:Riak(Basho Japan)
  • 第5回:Couchbase(Couchbase)
  • 第6回:Redis(アイレット)
  • 第7回:Apache Cassandra(DataStax)
  • 第8回:Neo4j(Neo4jユーザグループ)
  • 第9回:まとめ

NoSQLの主なカテゴリ

 NoSQLはさまざま種類の膨大なデータ量を高速かつ動的に整理し分析することを可能にする、非リレーショナルな分散データベースシステムです。知られているだけでも100を超えるさまざまな製品がありますが、大きく分けて4種類のカテゴリに分けられます。

 各製品にはそれぞれに特徴があり、向き不向きがありますので、製品選定の際には、特徴の違いを理解しておくことがとても重要になります。今回のシリーズで紹介する7つについても、どのカテゴリに分類されるか覚えておいてください

  • キーバリュー型:Riak、Redis
    多くのNoSQLがKey(キー)を持っていることから、基本はキーバリューに属しているとも言えます。データの管理、アクセスはキーに対して行い、そのキーに対してバリューが存在します。高速なパフォーマンスとデータ分散が行えるため拡張性に優れています。データの読込がRDBと比較して高速であることが特徴としてあります
  • ワイドカラムストア型: Apache Cassandra、Apache HBase
    列指向とも言われることもありますが、データはRDBのようにレコード(行)で管理されます。アクセスはキーバリューと同じようにキーを使用して列単位になります。列に対して数億件というデータの追加が可能で、RDBより柔軟性とパフォーマンス、拡張性で優れていていると言われ、データの書き込みが高速であることが特徴です
  • ドキュメント型:Couchebase、MongoDB
    キーに対してバリューではなく、より複雑なドキュメントとしてデータを格納します。JSONといったデータ記述書式で取り扱うことが可能で、半構造化データの取り扱いを得意とします。特に、複雑なデータ構造を扱うアプリケーションにおいては、生産性高く柔軟に開発できるメリットがあります
  • グラフ型:Neo4j
    グラフ理論に基づき、相互に結びついた要素で構成され、それぞれの間に任意の数の結びつきのあるデータ同士の関係をグラフとして表すのが適切なデータを対象とするように設計されます。グラフデータベースは、従来のRDBでは不可能だった形でデータの関係をモデル化し探索するのに役立つように作られており、データをグラフ型で格納した場合、RDBと比較して高速に横断検索をすることが可能です

 以下の表は、NoSQLデータベースを評価する際に考慮すべきいくつかの重要な特性を示します(表1)。

表1:NoSQLを評価する際に考慮すべき特性(筆者作成)
データモデルパフォーマンススケーラビリティ柔軟性複雑さ機能性
キーバリューなしさまざま(なし)
ワイドカラムストア最小限
ドキュメントさまざま(高)さまざま(低)
グラフさまざまさまざまグラフ理論

NoSQLへの動き

 データベースは1959年にW.C.McGee氏による論文で初めてその言葉が定義されたと言われています。1960年代に入るといくつかデータベースが発表され、1970年代から1990年代頃までは、メインフレームの全盛期時代がありました。大型コンピュータによって計算処理の高速化、記憶、記録装置が発展した、この時代のデータベースは階層型データベース(HDB)やネットワークデータベース(NDB)といったものです。

  • このエントリーをはてなブックマークに追加

関連ホワイトペーパー

SpecialPR

  • デジタル変革か?ゲームセットか?

    デジタルを駆使する破壊的なプレーヤーの出現、既存のビジネスモデルで競争力を持つプレイヤーはデジタル活用による変革が迫られている。これを読めばデジタル変革の全体像がわかる!

  • 「奉行シリーズ」の電話サポート革命!活用事例をご紹介

    「ナビダイヤル」の「トラフィックレポート」を利用したことで着信前のコール数や
    離脱数など、コールセンターのパフォーマンスをリアルタイムに把握するに成功。詳細はこちらから