Hadoop商用ディストロ「MapR」にストリーム処理--製品の体系と名称を変更

日川佳三 2016年04月25日 13時31分

  • このエントリーをはてなブックマークに追加

 オープンソースソフトウェア(OSS)の分散並列処理フレームワーク「Apache Hadoop」の商用ディストリビューションを開発、提供するマップアール・テクノロジーズは4月21日、米本社が開発した企業向け製品の現況を説明した。3月末からストリーミングデータをリアルタイムに処理する「MapR Streams」機能のライセンスを販売開始した。同時に、製品名を従来の「MapR M7」「同M5」「同M3」から「MapR Converged Data Platform」に変更した。

 新たな製品名のConverged Data Platform(コンバージドデータプラットフォーム)とは、データの収集と分析に必要な複数の機能群を複数の製品やサーバを組み合わせることなく、単一製品と単一サーバで実現できることを表している(図1)。多機能なファイルシステムをベースにこの上でHadoop、NoSQLデータベース、ストリーム処理の3つの機能モジュールを利用できる。

図1:MapRはファイルシステム上でHadoopやNoSQLなど複数の機能を利用できる
図1:ファイルシステム上でHadoopやNoSQLなど複数の機能モジュールを利用できる
マップアール・テクノロジーズ カントリーマネージャ 平林良昭氏
マップアール・テクノロジーズ カントリーマネージャ 平林良昭氏

 「MapRの製品を使わなかった場合、流れてくるストリームデータを処理してNASストレージやHadoopに保存したり、(キーバリューストア:KVSの)HBaseなどのNoSQLにデータを渡したりする場合、複数の製品とサーバが必要になる。サーバ間やミドルウェア間でのデータの移動だけで時間や負荷などのコストがかかってしまう」。

 マップアール・テクノロジーズでカントリーマネージャを務める平林良昭氏は、複数の機能を単一製品に統合している狙いをこう説明する。

いちから開発したファイルシステムに特徴、高速でマルチプロトコル

 MapRのHadoop製品の最大の特徴は、ファイルシステムの「MapR-FS」にある。OSSのHadoopの分散ファイルシステム「HDFS(Hadoop Distributed File System)」がJava言語で開発されているのに対して、MapR-FSはC/C++言語でストレージI/O周りの実装をいちから作り直している。ノード間のデータ転送もHTTPではなく、より低レベルなプロトコルを使う。こうした工夫によってHDFSよりも高速に動作する。

 MapR-FSではさらに、Hadoop標準のHDFSのインターフェースだけでなく、NAS(ファイル共有)ストレージのNFSのインターフェースや、NoSQLのHBase互換のインターフェースでアクセスできるようにしている。最近では「純粋に分散型NASストレージとしてMapR-FSを使うユーザーも増えた」(平林氏)という。また、MapR-FS上のデータにSAS Instituteのデータ分析ソフトから直接アクセスして分析する「SAS on MapR」の使い方も増えているという。

 MapR-FSの上で動作する機能モジュールとして今回、Hadoop機能(MapReduce)とNoSQL機能に次いでストリーム処理機能のMapR Streamsを加えた形だ。金融取引やIoT(モノのインターネット)センサなどのように絶えず流入してくるイベントデータをリアルタイムに処理する使い方ができる。

製品の体系も変更

 ストリーム処理機能のMapR Streamsの追加にあわせて製品名とエディション構成も整理した。従来は、有償エディションが上位版「MapR M7」と下位版「MapR M5」の2つ、無償エディションが「MapR M3」という区分けだった。M7とM5の違いはHBaseの実装で、M5はオープンソースのApache HBaseそのものだが、M7はファイルシステムにHBaseのAPIを組み込んでいた。

 新たな製品体系では、製品名を「MapR Converged Data Platform」に統一。エディションは、有償版「Converged Enterprise Edition」と無償版「Converged Community Edition」の2つとした。有償版は、ファイルシステムのMapR FSをベースに、ライセンスの追加によってHadoop、MapR-DB、MapR Streamsの3つの機能モジュールを自由に組み合わせられる。

 会見には、MapRのHadoop製品を活用した国内ユーザー2社が登壇した。1つはインターネット広告会社のサイバーエージェントで、高速にアクセスできることや、NFSストレージにMapReduceでアクセスできる点などを評価した。もう1つは医療系のデータ配信などを手がけるメディカル・データ・ビジョンで、医療機関から提供されたデータをリアルタイムに蓄積していける点などを評価した。

ZDNet Japan 記事を毎朝メールでまとめ読み(登録無料)

  • このエントリーをはてなブックマークに追加

この記事を読んだ方に

連載

CIO
ITアナリストが知る日本企業の「ITの盲点」
シェアリングエコノミーの衝撃
デジタル“失敗学”
コンサルティング現場のカラクリ
Rethink Internet:インターネット再考
インシデントをもたらすヒューマンエラー
トランザクションの今昔物語
エリック松永のデジタルIQ道場
研究現場から見たAI
Fintechの正体
米ZDNet編集長Larryの独り言
大木豊成「仕事で使うアップルのトリセツ」
山本雅史「ハードから読み解くITトレンド放談」
田中克己「展望2020年のIT企業」
松岡功「一言もの申す」
松岡功「今週の明言」
内山悟志「IT部門はどこに向かうのか」
林 雅之「デジタル未来からの手紙」
谷川耕一「エンプラITならこれは知っとけ」
大河原克行「エンプラ徒然」
内製化とユーザー体験の関係
「プロジェクトマネジメント」の解き方
ITは「ひみつ道具」の夢を見る
セキュリティ
エンドポイントセキュリティの4つの「基礎」
企業セキュリティの歩き方
サイバーセキュリティ未来考
ネットワークセキュリティの要諦
セキュリティの論点
スペシャル
エンタープライズAIの隆盛
インシュアテックで変わる保険業界
顧客は勝手に育たない--MAツール導入の心得
「ひとり情シス」の本当のところ
ざっくり解決!SNS担当者お悩み相談室
生産性向上に効くビジネスITツール最前線
ざっくりわかるSNSマーケティング入門
課題解決のためのUI/UX
誰もが開発者になる時代 ~業務システム開発の現場を行く~
「Windows 10」法人導入の手引き
ソフトウェア開発パラダイムの進化
エンタープライズトレンド
10の事情
座談会@ZDNet
Dr.津田のクラウドトップガン対談
Gartner Symposium
IBM World of Watson
de:code
Sapphire Now
VMworld
Microsoft WPC
Microsoft Connect()
HPE Discover
Oracle OpenWorld
Dell Technologies World
AWS re:Invent
AWS Summit
PTC LiveWorx
吉田行男「より賢く活用するためのOSS最新動向」
古賀政純「Dockerがもたらすビジネス変革」
中国ビジネス四方山話
ベトナムでビジネス
日本株展望
企業決算
このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]