ペタバイト級のデータを蓄えられるデータベース専用機「Oracle Exadata Database Machine」を提供する米Oracleの“Big Data(ビッグデータ)”対応策はこれまで構造化データが中心だった。だが、同社は今後非構造化データへの対応も強化していく。
米Oracleは10月3日、ビッグデータに対応するアプライアンス「Oracle Big Data Appliance」を同社開催のイベント「Oracle OpenWorld 2011」で発表した。ハードウェアとソフトウェアを一体化して製品を開発するというOracle独自のコンセプト“Engineered System”に基づいている。
Big Data Applianceの大きな特徴は、非構造化データにいかに対応するか、という点での解決策を求めたことにある。というのは、非構造化データの分析に強いとされる分散並列処理フレームワーク「Apache Hadoop」に対応しているからだ。
Big Data Applianceは、リレーショナルデータベース管理システム(RDBMS)「Oracle Database(DB)11g」を中核に、Hadoopディストリビューション、分散キーバリューストア(KVS)型データベース(DB)の「Oracle NoSQL Database」「Oracle Data Integrator with Application Adaptor for Hadoop」や「Oracle Loader for Hadoop」「Oracle R Enterprise」、Linuxディストリビューション「Oracle Linux」「Oracle Java HotSpot Virtual Machine」で構成される。
NoSQL DatabaseはKVS型のDBであり、競合よりもインストールや構成、管理が容易で、幅広いワークロードをサポートしているという。Oracleのサーバテクノロジ担当シニアバイスプレジデントのAndrew Mendelsohn氏は10月3日のデータベースゼネラルセッションの中で、NoSQL Databaseのメリットとして拡張性の高さを挙げている。「24ノード、48ノード、96ノードとノードを増やしていくと、リニアでパフォーマンスが上がっていく」と説明している。
Data Integrator with Application Adaptor for Hadoopは、データ連携ソフト「Oracle Data Integrator」のアダプタであり、HadoopとOracle DBとのデータ統合が容易になるというもの。「Hadoopのプロセスの複雑さを軽減して、よりシンプルにできる」(Mendelsohn氏)という。
Loader for Hadoopは、Hadoop/MapReduce処理を利用して、Oracle DBで効率的なロードと分析を行うために最適化されたデータセットを作成できるという。ほかのHadoopローダと違って、Oracle DB内部形式を生成することから、データロードが高速化され、DBシステムのリソース使用率が低下するとしている。
R Enterpriseは、オープンソースソフトウェア(OSS)の統計解析処理の「R」言語とOracle DBを統合したものだ。現在、Rアプリケーションは拡張性の高いといわれているが、このRアプリケーションは「ノートPCのローカルディスクに格納して使うことが前提」(Mendelsohn氏)という。そのため、企業が保有する数テラバイトや数ペタバイトといったデータの解析にはセキュリティ上の懸念からも向いていないと言われる。
OSSのRと互換性があるというR Enterpriseの場合、サーバにあるOracle DB 11g上に格納されているデータに対して、Rのクライアントソフトから処理を展開することができるとしている。拡張性やパフォーマンス、セキュリティが向上することで、エンタープライズクラスの密接に結合された環境が実現し、高度な分析が可能と説明している。
Mendelsohn氏は、Big Data Applianceを活用することで複雑な分析を行えるという。たとえば、小売店で若い女性を対象にしたデザイナーセーターがなぜか売れていないという結果になったとする。そこでTwitterで分析してみると、Twitter上には「在庫がなかった」という声があふれている。だが、実際にそのデザイナーセーターの在庫は各店舗に存在していた。
どういうことなのかより深く状況を分析してみると、デザイナーセーターと一緒に買いたいと思われていた白いシャツの在庫がなかったことがTwitterやFacebookといったソーシャルメディアの声で明らかになった。Mendelsohn氏は、Big Data Applianceを活用すれば、こうした複雑な状況も明らかになると、そのメリットを強調している。