OSSとビッグデータアナリティクス

アナリティクス・エコシステムが実現する世界

島田 茂(日本テラデータ)

2016-10-21 08:15

 本連載では、アナリティクスの考え方や進め方を整理するために、データ取得と格納、データ整理と加工、モデル構築、ビジュアライゼーションの意義について順を追って解説し、同時にアナリティクスを活用できるオープンソース・ソフトウエアの要素技術、ツールを簡単に紹介してきた。

 最終回となる今回は、OSSとビッグデータ・アナリティクスについての総括をしながら、包括的なアーキテクチャ(アナリティクス・エコシステムとも呼ばれる)を振り返りたい。

オープンソース

オープンソースを利用するメリット

OSSの発展

 1990年代前半のLinuxの登場からすでに20年超。オープンソースのコミュニティも成熟してきており、各ソフトウェアの完成度も商用製品とほぼ変わらないレベルになってきた。Linuxが企業の基幹システムに徐々に取り込まれていったように、Linux以外のOSSのアプリケーションも取り込んで行くという流れになりつつある。

 それは、OSSで開発されている多様なソフトウェアやライブラリの中から、自社に合うものを採用する自由度が企業にとって重要になってきているからであろう。

OSSの取り込みの必然性

 従来、データベースや統計分析ソフトウェアを専業とする企業は、処理能力やユーザービリティなどに工夫を凝らし、特定技術で差別化をしてきた。一方、ビッグデータ・アナリティクスを支える要素技術は、多様化・深化・発展を続けており、1つの企業が要素技術を全てカバーし、第1回に示した「包括的なアーキテクチャ」を製品として供給していくことは、研究開発費用などを考えると現実的に難しいと考えられる。

 実際に、アナリティクスを支える要素技術は、データ取得・蓄積から、大量データ加工・処理、統計分析から機械学習(AI)、可視化まで多岐にわたっており、図1に示すようにOSSのコミュニティを中心に開発されている。

クラウドサービスの台頭

 ここ10年でクラウドサービスも発展し、煩わしいハードウェアの管理をせずとも、システム基盤をオンデマンドで利用できる時代となった。インターネットの基礎技術のほとんどがOSSをベースにして発展しているため、OSSとクラウドサービスとの親和性は高い。クラウド上にサーバーを立てて、OSSで構成される包括的なアーキテクチャを1日で実装するということも可能である。

アナリティクスへの取り組み

 クラウド環境の中で、オンデマンドでのITインフラとOSSの利用で、システム導入を低コストで実現することができるようになったため、大規模なシステムを構築する必要もない。特にアナリティクス自体は、Fail Fastの考えのもと、スモールスタートで取り組んでいけば、多額の投資も抑えることができる。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

注目している大規模言語モデル(LLM)を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]