ビッグデータは嘘でも万能でもない--グーグルの「インフルトレンド」論議から考える - (page 2)

Nick Heath (TechRepublic) 翻訳校正: 川村インターナショナル

2014-05-21 07:30

 このようなビッグデータに対する攻撃を受けて、The EconomistのKenneth Cukier氏は先頃、ビッグデータを擁護する発言をした。

 Cukier氏はロンドンで開催されたBig Data Weekカンファレンスで、「もちろん、それはたわごとではないし、たわごとだと考えるのがばかげたことだ」と語った。同氏は、主にデータセットを拡大することで大幅な改善が見られた分析システムのさまざまな例に言及し、音声認識や翻訳、オンラインレコメンデーションエンジンやサジェスト検索エンジンを例に挙げた。

 Cukier氏はワードプロセッサの文法チェッカーについて、その調整に使われるデータセットが50万語から10億語に増えたことで飛躍的に良いものになっており、手作業のコーディングによる包括的な文法ルールで可能なレベルよりもはるかに向上していると述べた。

 ビッグデータへの批判の波を引き起こした論文である「The Parable of Google Flu: Traps in Big Data Analysis(Google Fluという寓話:ビッグデータ分析の落とし穴)」に話を戻すと、これはGoogle Flu Trends全体に対する批判ではない。この論文の主張は、「スタンドアロン型のインフルエンザモニタとしてのこのアルゴリズムの相対的な価値には疑問の余地がある」ということだった。しかしCukier氏が指摘しているように、この論文では、インフルエンザ大流行の最も正確な予測は、Google Flu Trendsのデータと、CDCの予測のようなほかの「健康に関するリアルタイムに近いデータ」を組み合わせることによって得られたとも書かれている。

 ビッグデータは役に立たないのかどうかというところに議論を帰着させるべきではない。Spiegelhalter氏の批判の矛先は、ビッグデータという分野ではなく、その分野に対するもっとおかしな主張に向けられていた。ビッグデータ推進派に対する最も激しい批判はまだ続いているように筆者には思える。そして大規模なデータセットがあれば、少ないデータでは見えない傾向を明らかできるものの、サンプルのエラーや偏りという問題は依然として存在するようだ。

この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    「デジタル・フォレンジック」から始まるセキュリティ災禍論--活用したいIT業界の防災マニュアル

  2. 運用管理

    「無線LANがつながらない」という問い合わせにAIで対応、トラブル解決の切り札とは

  3. 運用管理

    Oracle DatabaseのAzure移行時におけるポイント、移行前に確認しておきたい障害対策

  4. 運用管理

    Google Chrome ブラウザ がセキュリティを強化、ゼロトラスト移行で高まるブラウザの重要性

  5. ビジネスアプリケーション

    技術進化でさらに発展するデータサイエンス/アナリティクス、最新の6大トレンドを解説

ZDNET Japan クイックポール

注目している大規模言語モデル(LLM)を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]