IBMはApache Hadoop用のアナリティクスツール、「BigInsights for Apache Hadoop」を発表した。同社がHadoop用の管理および解析プラットフォーム「PureData System」の戦略を発表してから2年近くが経過したが、BigInsights for Apache Hadoopの投入により、同社はデータサイエンス市場における戦略展開の加速を図る。
BigInsights for Apache Hadoopは、データ探索、データ視覚化、および大規模な分散型機械学習を実行するための広範なデータサイエンスツールセットを提供することで、大規模な変動的データの潜在価値を最大限に引き出し、ビッグデータのビジネス活用で困難に直面している企業を支援する。
BigInsights for Apache Hadoopは、「BigInsights Analyst」「BigInsights Data Scientist」「BigInsights Enterprise Management」という3つのモジュールで構成される。
BigInsights Analystは、IBMのSQLエンジン、直感的なスプレッドシート、視覚化機能を搭載し、必要なデータの迅速で容易な抽出を実現する。IBMによると、Hadoop上で1年間に実行されるSQLクエリの数は平均して数百万件に達するが、BigInsights Analystを導入すれば、それらクエリの効率性を数倍に向上させることが可能だという。
BigInsights Data Scientistは新たな機械学習エンジンで、データの規模に応じて自身のパフォーマンスを自動的に調整し、有用なパターンを効率的に認識する。また、Decision Tree、PageRank、Clusteringなど、十数種類の業界に特化したアルゴリズムを搭載する。さらに、オープンソースの統計解析用言語「R」をネイティブでサポートするため、既存のRアルゴリズムも最大限に活用できる。
BigInsights Enterprise Managementは、リソースの効率的な配置とワークフローの最適化を支援する幾つかの新しい管理ツールを提供することで、迅速な結果取得を支援する。
なお、IBMは今回の発表に併せて、企業が求めるデータアクセス制御と認証機能を提供する「Open Platform with Apache Hadoop」と、Apache Sparkのサポート追加も発表した。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。