ビッグデータはなぜ分かりづらいのか--肥大化のメカニズム - (page 2)

Ken Hess (Special to ZDNET.com) 翻訳校正: 村上雅章 野崎裕子

2013-07-05 07:30

 要するにメタデータはデータそのものではないものの、格納するためのスペースを必要とするというわけだ。これはデータについてのデータである。このため、ビッグデータを議論する際には、ビッグメタデータも議論する必要がある。データは単にデータそのものだけでなく、より多くのデータを内包しているということを理解できれば、データが現在のようなペースで増大している理由も見えてくるはずだ。

 ただ、ここで明確にしておきたいのは、メタデータはビッグデータを「大きなもの」にしているのではなく、すでに大きいビッグデータを「より大きなもの」にしているという点である。

 データとメタデータの理解が深まったところで、ビッグデータの本質を探究していきたい。

 ビッグデータとは大量のデータのことである。これはわれわれが今までに扱ったことのあるデータよりも多くのデータであり、かつさまざまな情報源から生み出されている。そしてメタデータも忘れてはならない。このため考えることは山ほどあり、格納スペースは大量に必要となり、分析対象もおびただしいほどある。これらが、ビッグデータにおける重要な課題となるわけだ。

 データが一定量を越えて肥大化し、その巨大さが問題となった場合、それは間違いなくビッグデータだと言えるだろう。

 それでも、ビッグデータの理解を妨げているものが何であるかといぶかしんでいる方がいるかもしれない。

 上述したように、データはさまざまな情報源から生み出されている。そういった情報源には携帯電話や、人工衛星、電子的なセンサ類、テキストメッセージ、ログファイルといったものが含まれている。これほど多くの情報源から生み出されたデータは非常に複雑なものとなる。

 詳しく説明してみよう。データがすべて写真なのであれば、それは単純なものとなる。しかし、データ型が複数存在し、情報源も複数ある場合、複雑さが忍び寄ってくるのである。例えば、あなたがUPS(注2)のような輸送会社を経営している場合、さまざまな情報源に由来するデータが考えられるはずだ。複雑さというものを感じてもらえるよう、従業員とトラック、荷物という情報源を考えてみよう。実際のデータがさらに複雑であるのはもちろんだが、ここでは手頃な例としてこの3つを用いてみたい。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

注目している大規模言語モデル(LLM)を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]