ビッグデータからどう価値を得るか

栗原潔 (テックバイザージェイピー) 2011年09月20日 15時34分

  • このエントリーをはてなブックマークに追加

 本特集「ビッグデータとは何か」の過去2回では、ストレージ、そしてデータ管理という「ビッグデータ」のインフラについて述べてきた。今回は「ビッグデータ」のアプリケーション(応用)について考えていこう。

広くとらえたいビッグデータの応用

 最初に述べておきたい点は、一般的な認識では「ビッグデータ」は(大量データの)分析と表裏一体ととらえられているかもしれないが、その認識はやや限定的にすぎるのではないかということだ。もちろん、データ分析が「ビッグデータ」の最も重要な活用法であることは否定しないが、本特集の第1回でも述べたように、ビッグデータの応用分野は分析だけではなく、大量データの配信(典型的にはマルチメディアストリーミング)と保存(典型的にはイメージ情報のアーカイブ)も含めて考えるべきだ。

 「ビッグデータ」が多様なアプリケーションで活用される以上、その有効活用にはインフラとデータの共用が不可欠だ。アプリケーションごとにデータ管理のインフラを縦割り型に作る従来のやり方は、(従来でも大きな問題であったのだが)ビッグデータの世界ではあまりに非効率的だ。ペタバイト級のデータを準備して特定のアプリケーションでしか利用できないというのではお話にならないだろう。

 また、「ビッグデータ」の世界では今まで想定されていなかったデータの活用法が生まれることがある点にも注意が必要だ。たとえば、検索エンジンへの入力ログの活用法としてすぐに思いつくのは、検索語の傾向分析、ランキングアルゴリズムの改善、追加検索語のサジェストなどだ。

 これに加えて、Googleをはじめとするサーチエンジンでは、入力ログを活用した入力修正機能(いわゆる「もしかして」機能)の提供が一般的になっている。大量の入力ログデータを分析し、たとえば「蓮根ミク」と入力した直後に「初音ミク」と入力して検索するユーザーがある程度いることがわかったとする。その場合には「蓮根ミク」は「初音ミク」の入力ミスである可能性が高いとして、「蓮根ミク」と入力したユーザーに対して「もしかして『初音ミク』のことですか」と尋ねることができる。文字コード的には「蓮根」と「初音」はまったく違うので、単純なスペルチェックのアルゴリズムでこのように自動修正することは難しい。

 ここでのポイントは、ある目的のために収集されたビッグデータに対して、後からまったく別の活用法が発見されることが多いということだ。ビッグデータのインフラとデータ管理ポリシーは、このような、収集時には思いもつかなかった新たな応用の登場に備えた柔軟性の高いものでなければならない。

  • このエントリーをはてなブックマークに追加

関連ホワイトペーパー

SpecialPR

連載

CIO
研究現場から見たAI
ITは「ひみつ道具」の夢を見る
内製化とユーザー体験の関係
米ZDNet編集長Larryの独り言
今週の明言
「プロジェクトマネジメント」の解き方
田中克己「2020年のIT企業」
松岡功「一言もの申す」
林 雅之「デジタル未来からの手紙」
谷川耕一「エンプラITならこれは知っとけ」
Fintechの正体
内山悟志「IT部門はどこに向かうのか」
情報通信技術の新しい使い方
三国大洋のスクラップブック
大河原克行のエンプラ徒然
コミュニケーション
情報系システム最適化
モバイル
通信のゆくえを追う
セキュリティ
サイバーセキュリティ未来考
セキュリティの論点
ネットワークセキュリティ
スペシャル
Gartner Symposium
企業決算
ソフトウェア開発パラダイムの進化
座談会@ZDNet
Dr.津田のクラウドトップガン対談
CSIRT座談会--バンダイナムコや大成建設、DeNAに聞く
創造的破壊を--次世代SIer座談会
「SD-WAN」の現在
展望2017
IBM World of Watson
de:code
Sapphire Now
VMworld
Microsoft WPC
HPE Discover
Oracle OpenWorld
Dell EMC World
AWS re:Invent
PTC LiveWorx
古賀政純「Dockerがもたらすビジネス変革」
さとうなおきの「週刊Azureなう」
誰もが開発者になる時代 ~業務システム開発の現場を行く~
中国ビジネス四方山話
より賢く活用するためのOSS最新動向
「Windows 10」法人導入の手引き
Windows Server 2003サポート終了へ秒読み
米株式動向
実践ビッグデータ
日本株展望
ベトナムでビジネス
アジアのIT
10の事情
エンタープライズトレンド
クラウドと仮想化