NoSQLデータベースを手がけるCouchbaseは米国時間2月19日、同社のオープンソースデータベースとHortonworksの「Apache Hadoop」データプラットフォームの統合を発表した。これにより企業が単一のシステム上で業務データと分析データの双方を取り扱えるようになるという。
Couchbaseは、分散メッセージングには「Apache Kafka」を、ストリームデータ処理には「Apache Storm」を用いて、「Couchbase Server 3.0.2」と「Hortonworks Data Platform 2.2」(HDP 2.2)を統合することになる。
今まで業務データと分析データは個別に扱われてきており、静的かつ大規模なオフラインデータセットの分析には昔からHadoopが用いられてきている。
Couchbaseの説明によると、同社のデータベースとHortonworksのHadoopの統合では、Apache KafkaがCouchbase Serverの「データベース変更プロトコル」(DCP)を用いてCouchbase Serverからのデータをリアルタイムでメッセージキューにストリーミングするという。
いったんメッセージがApache Stormによって処理された後、そのデータはさらなる処理のためにHadoopに渡されるとともに、分析結果がCouchbase Serverに書き込まれる。ユーザーはCouchbase Serverにアクセスすることで、リアルタイムのレポートや視覚化ダッシュボードを利用できる。
Hortonworksはまた、Couchbase Server 3.0.2とHDP 2.2の間の双方向データ転送をサポートするための、「Apache Sqoop」向けCouchbase Serverプラグインを認定している。
Apache SqoopはApache Hadoopと、RDBを始めとする構造化されたデータストアの間で大量のデータをやり取りするためのツールだ。2012年3月にApacheのインキュベータから卒業し、現在はトップレベルプロジェクトに なっている。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。