包括的なアーキテクチャ
人の思考過程そのものあるアナリティクスの基本は、OSSを活用する環境においても変わらない。反復的なアナリティクスのプロセスを包括的に加速するためにはアーキテクチャが重要となる。
何を目的として、どのような考え方でアナリティクスを始めるか、より大きく複雑なデータを蓄積し、効果的、効率的に扱うために、どのようなプロセスや手順でデータを取り扱うか、そして各ユーザーがアナリティクスの結果から示唆を抽出できるようにどのように見せるかを統合して扱える時代になった。
この統合された包括的なアーキテクチャはシンプルに5つのステップ、機能が必要だ。
- さまざまなソースからデータを取得する
- データの格納方法・場所
- 分析用データセットの加工・作成
- さまざまな分析手法の組合せ
- 各ユーザーに合わせた分析結果の見せる化
上記、取り組みの代表的なコンセプトとしてガートナーが提唱し始めたロジカルデータウェアハウス構想がある。オンプレミスとクラウドのハイブリッド環境、商用ソフトウェアとHadoopなどのOSSを組み合わせたエコシステムによる包括的なビッグデータ対応アーキテクチャであり、論理的には一つの巨大なデータウェアハウスと考える概念だ。
本稿では、上記5つの要素を中心に、アナリティクスのためのOSS活動・ソリューションを紹介しながら、ビッグデータ対応の包括的アーキテクチャによる統合的アプローチの勘所などを解説していく。
- 島田 茂
- 日本テラデータ プロフェッショナル・サービス本部 ビッグデータ分析ラボ 部長
- プロフェッショナル・サービス本部ビッグデータ分析ラボを統括。過去には、先進ITソリューション・製品の研究開発を大手IT会社にて国内および国外(主に米国・英国)の研究所で従事。その後、グローバル企業における日本法人の営業経験を通じて、経営に興味が高まりOSSを普及させるベンチャー企業を設立。テラデータの新たなチャレンジに魅せられ日本テラデータに入社、ビッグデータ分析ラボ(通称BAL:バル)を立上げ、今に至る。5月19日に開催予定の「TERADATA UNIVERSE TOKYO 2016」では、「オープンソースにコミットするテラデータ 分析エコシステム」(ランチセッションL1:12:00開始)と題したセッションで講演予定。島田氏のほか、共著者は次の2人。日本テラデータ ソリューション・セールス・スペシャリスト 長谷川 亮氏、日本テラデータ プロフェッショナル・サービス本部 ビッグデータ分析ラボ コンサルタント 樫下 茂氏。