近年、「モノのインターネット(Internet of Things:IoT)」やモバイル・デバイス、ソーシャル・メディアなどの台頭で、企業が保有するデータ量は爆発的に増加している。米国IDCの調査予測によると、2020年までに全世界のデータ量は、2009年の44倍に相当する35ゼタバイトに達し、その80%が非構造化データであるという。
こうしたビッグデータをビジネスで活用する動きは加速している。米国IDCは、世界のIoT市場が2020年には71兆ドル規模になると予測している。もちろん、日本も例外ではなく、IDC Japanによる国内市場予測では2019年には16.4兆円に達すると予測されている。
ビッグデータを活用するにあたり、注目されているのがNoSQL(Not only SQL)データベースだ。NoSQLは、さまざまな種類の膨大な非構造化データを、高速かつ動的に整理/分析する。データを分散させて並列処理することで、高い処理能力を発揮するデータベースだ。
従来のデータベースは、RDB(リレーショナルデータベース)が主流であった。RDBはデータを一元管理し、トランザクションによるデータの一貫性を保証するといったメリットがあるものの、サーバの処理性能を上げるためには、メモリやプロセッサを増設する必要がある。しかし、IoTやSNSなど、数百万単位のユーザー(デバイス)が頻繁にアクセスしてデータを更新するといった、「ビッグユーザーによる、スモールデータの、ビッグなデータ更新」を適切に処理するためには、拡張性の面からもコストの面からも、そしてパフォーマンスの面からも、RDBの仕組みだけでは対応が難しい。こうしたデータをリアルタイムで活用するためには、高い処理能力を持ち、かつサーバ数を柔軟に追加できるという、水平拡張が可能なスケーラビリティを持ったデータベースが必要となる。それがNoSQLというわけだ。
NoSQLは、「ドキュメント指向型」「キーバリュー型」「列指向型」、そして「グラフ型」の4種類のカテゴリに大別される。各種類はそれぞれに特徴があるが、共通しているのは、水平拡張に優れていることだ。中でもドキュメント型は、半構造化ドキュメントデータ形式のJSON(JavaScript Object Notation)ので、データを出し入れできる。RDBのようなデータ設計が不要で、カラムを定義することなくデータを出し入れできることから、ニュースサイトやブログ記事、さらにWebアプリケーションの開発などに幅広く利用されている。
また、ドキュメント指向型は、ドキュメントをユニークIDですぐに特定できる特性を持つ。そのため、ユーザーが生成するコンテンツ以外でも、M2Mのバックエンドや、ログデータ/ユーザークリック履歴/画面遷移履歴/通信記録といったバックオフィス系のデータベースとしても利用されている。
日本アイ・ビー・エム アナリティクス事業部 インフォメーション・アーキテクトである野間愛一郎氏は、「ドキュメント指向型(JSON)は、Webアプリケーションと親和性の高いデータ形式なので、アプリ開発に最適です。すでに米国ではJSONを活用し、社内でアプリを開発したり、それに合わせてバックオフィスを改変したりという事例が多くあります。われわれが提供するドキュメント指向型(JSON)の『Cloudant』は、ビッグデータやIoTの利活用に最適なドキュメント・データベースなのです」と説明する。
"システムのお守り"は一切必要なし
「DBaaS」というアドバンデージ
Cloudantは、クラウドで提供するNoSQLのデータベースである。ベースとなっているのはオープンソースの「Apache CouchDB」であり、それに加えて、全文検索機能、地理情報関数、レプリケーション、クライアントとの同期機能、MapReduce(マップリデュース)などを標準機能として備える。インタフェースは「RESTful API」を採用しているので、現在利用している言語で簡単にデータベースを操作できる。

※クリックすると拡大画像が見られます
野間氏は、「Cloudantの標準搭載機能はシンプルですが、JSONのメリットを享受するには必要十分なものです」と説明する。MapReduceはデータの順位や分析などに力を発揮する。また、地理情報関数を使えば、特定地域でどのようなツイートがされているのかを、リアルタイムで可視化できる。全文検索についても、機能統合され、ユーザーが何らかの準備をする必要なく利用できるようになっている。