ビッグデータはなぜ分かりづらいのか--肥大化のメカニズム - (page 2)

Ken Hess （Special to ZDNET.com）翻訳校正：村上雅章野崎裕子

2013-07-05 07:30

　要するにメタデータはデータそのものではないものの、格納するためのスペースを必要とするというわけだ。これはデータについてのデータである。このため、ビッグデータを議論する際には、ビッグメタデータも議論する必要がある。データは単にデータそのものだけでなく、より多くのデータを内包しているということを理解できれば、データが現在のようなペースで増大している理由も見えてくるはずだ。

　ただ、ここで明確にしておきたいのは、メタデータはビッグデータを「大きなもの」にしているのではなく、すでに大きいビッグデータを「より大きなもの」にしているという点である。

　データとメタデータの理解が深まったところで、ビッグデータの本質を探究していきたい。

　ビッグデータとは大量のデータのことである。これはわれわれが今までに扱ったことのあるデータよりも多くのデータであり、かつさまざまな情報源から生み出されている。そしてメタデータも忘れてはならない。このため考えることは山ほどあり、格納スペースは大量に必要となり、分析対象もおびただしいほどある。これらが、ビッグデータにおける重要な課題となるわけだ。

　データが一定量を越えて肥大化し、その巨大さが問題となった場合、それは間違いなくビッグデータだと言えるだろう。

　それでも、ビッグデータの理解を妨げているものが何であるかといぶかしんでいる方がいるかもしれない。

　上述したように、データはさまざまな情報源から生み出されている。そういった情報源には携帯電話や、人工衛星、電子的なセンサ類、テキストメッセージ、ログファイルといったものが含まれている。これほど多くの情報源から生み出されたデータは非常に複雑なものとなる。

　詳しく説明してみよう。データがすべて写真なのであれば、それは単純なものとなる。しかし、データ型が複数存在し、情報源も複数ある場合、複雑さが忍び寄ってくるのである。例えば、あなたがUPS（注2）のような輸送会社を経営している場合、さまざまな情報源に由来するデータが考えられるはずだ。複雑さというものを感じてもらえるよう、従業員とトラック、荷物という情報源を考えてみよう。実際のデータがさらに複雑であるのはもちろんだが、ここでは手頃な例としてこの3つを用いてみたい。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

メールマガジン購読のお申し込み

ビッグデータはなぜ分かりづらいのか--肥大化のメカニズム - (page 2)

「特集」バックナンバー

関連記事

関連ホワイトペーパー

特集

CNET Japan Top Story

ホワイトペーパー

新着

ランキング

ZDNET Japan クイックポール

関連記事

NEWSLETTERS

「特集」 バックナンバー

関連記事

関連ホワイトペーパー

特集

CNET Japan Top Story

ホワイトペーパー

新着

ランキング

ZDNET Japan クイックポール

関連記事

NEWSLETTERS

「特集」バックナンバー