編集部からのお知らせ
新着の記事まとめ「通信障害と社会リスク」
注目の記事まとめ「機械学習の現在」
エリック松永のメディア・デモクラシー講座

ビッグデータ時代のセクシーな仕事--データサイエンティストに求められるもの - (page 3)

松永 エリック・匡史(プライスウォーターハウスクーパース)

2013-04-20 11:13

フィルタリングにはどんな種類があるのか

 さまざまなフィルタリング手法が存在しますが、大きく分けると次の3パターンに集約されます。

  • 商品を起点にしたフィルタリング
  • ユーザーを起点にしたフィルタリング
  • 提供者の意図を反映したフィルタリング

 商品を起点にしたフィルタリングでは、商品の属性から他の商品への関連性を分析し商品を絞り込み推奨します。例えば有名テニスプレーヤーのテニスウェアを購入した場合、テニス→有名選手のグッズラケット・ボール→テニス関連サービス→テニス観戦ツアーといったように商品の関連を分析し推奨する商品を絞り込みます。コーヒーメーカーを購入するとコーヒー豆が推奨されるのも、あるマンガを購入すると続編が推奨されるのも、この商品起点のフィルタリングによるものです。

 商品ではなくユーザー(人)を起点にフィルタリングする方法もあります。これは徹底的に個人のウェブサイトでの行動履歴や購買履歴を分析することによって個人の購買行動を記録し、似たような行動や購買をするであろう特徴を持つ人とマッチングさせることによって今後購買する可能性のある商品を絞り込むフィルタリング手法です。行動や購買履歴が似ている人は同じような嗜好性を持っているという仮説の上になりたった手法です。この手法の欠点は、新製品(誰も購入したことのない商品)には活用できないことです。

 上記2つのフィルタリングには共通した弱点があります。それは、ユーザ数、購買実績、商品のバリエーションの量がないと分析データとしての信憑性に欠ける事です。この場合、伝統的な方法になりますがウェブ上でも感覚、センスを起点に商品をフィルタリングする方法もあります。

 例えば映画であれば映画の専門家が推奨する映画をユーザー共通に対して行う、有名映画評論家の推薦映画のコマーシャルのようなイメージです。これは新作でも、ユーザ数が少なくても効果を期待できます。

フィルタリングの成功要因

 フィルタリングの種類を解説しましたが、実際には簡単に成果が得られるわけではありません。コンピュータはプログラムで指示したことしか実行しません。なので、プログラムが思った通りの動きをしなければプログラムを書き換えなければなりません。

 フィルタリングで重要なのは、主にこのような項目です。

  • どの情報をインプットにするか
  • その情報はそのように得られるのか
  • 分析した情報をどう活用するか
  • 成果をどう評価するか
  • 評価からどこを修正すべきか

 これらを実行するためにはさまざまなスキルを持つ人材が必要です。成果を得るための基本的なロジックを作成するには、商品や市場の特性を知ったマーケティングや戦略系コンサルティングの知識が必要ですし、情報の分析には統計や数学に長けた分析プロフェショナルの知識が必要です。また、インプット情報を得る仕組みや大量データを迅速に分析する仕組みを構築するため、専用アプリケーションを開発し、大量データを処理するデータベースのITプロフェッショナル知識も当然必要となってきます。

 では、こういった様々なプロフェッショナル知識・技術を持つのは、いったいどんな人物、どのような職業の人なのでしょうか?

 おそらくこの講座の読者の方々でしたら、大勢の方がすぐに「データサイエンティスト」という名称を想起されたのでないかと思います。最近では一種のバズワードのようになり、あちこちのウェブサイトや新聞・雑誌で特集を組まれていたりするので、一度は耳にしたことがあるのではないかと思います。ただ改めて考えてみると、「データサイエンティスト」とはいったい何なのでしょう?

ZDNet Japan 記事を毎朝メールでまとめ読み(登録無料)

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNet Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]