トップインタビュー

データ分析の民主化が進んでいる:データビークル油野CEO

吉澤亨史 山田竜司 (編集部)

2016-01-14 12:00

 データビークルは、「誰もがビッグデータの価値を引き出せる世界を実現する」ことを目的に設立されたデータサイエンス専門企業。2015年12月には電通デジタル・ホールディングスからの出資が発表されるなど、注目が集まっている。IT業界での営業経験が豊富な油野達也氏が代表取締役で最高経営責任者(CEO)を務め、『統計学が最強の学問である』の著者である西内啓氏が取締役で製品の責任者に、個人投資家である山本一郎氏が取締役で最高財務責任者(CFO)に就任して脇を固めるという。今回は、同社の取り組みや特徴、今後について、油野氏に話を聞いた。

――データビークルとはどんな企業か。その成り立ちは。

 データを分析する際に“どんな項目同士をかけ合わせれば知見が導き出せそうか”を調べるためのツールを販売しています。所属していたベンチャーが上場した時のことです。投資家の山本から私に紹介があったのが、統計家の西内が作ったデータ分析ソフトでした。ソフトはコンセプトや機能は面白いものの、ユーザーインターフェース(UI)などが整っておらず、あれこれ相談しているうちに私もジョインすることになりました。


データビークル 代表取締役CEO 油野達也氏

 ソフトは西内がデータ分析に関連する本を出した関係で、データ分析で失敗している企業をコンサルティングしながら、「自分がやってる機械的な作業をプログラムにしてしまえば良い」と考えながら構想したものといいます。統計が専門である西内にはビジネスや実業務などの分析結果から何が正解かを判断するのは難しいが、依頼者から正解を引き出すことはできると。(知見を導き出すための)依頼者と統計学者のキャッチボールの手法を研修で教示した後、RやSQLで作ったプログラムをパッケージにしたら上手く行くのではと考えたそうです。

――そして完成したのがSaaSの分析ツール「DataDiver」。これはどのような製品か。

 ビジネスインテリジェンス(BI)ソフトでの分析を援助するためのツールです。BIツールでは、分析するときに対象となる項目を決めます。仮説を立ててさまざまな項目同士の相関を探していくのですが、関連性のわかるグラフをいくつか作成するだけでに何カ月もかかってしまうこともあります。大量のデータを用意して、データを分析できる形に整形し、プログラミングするためです。

 BIツールを使いこなすには仮説をいかにうまくたてるか、どんな項目同士を掛け合わせるかわかることが重要です。DataDiverは、その仮説を立てる製品です。

 データを全部入れて、その後にアウトカム(成果)、たとえば来店数が多いとか、ウェブの滞在時間の長さなどの説明変数を探すのです。そうすると、たとえば年齢や家族構成など、仮説を表示してくれます。仮説が分かれば、それでBIツールで分析します。

 BIツールだけで仮説と検証をくり返しても、いつまで経っても回答が出ません。たとえコンサルタントを入れても、誰でも推測できるような結果が出てきても成果はうすい。「携帯電話の解約率が最も高いのは、(違約金のない)購入から24カ月後」といった回答では成果がみえない。仮説の検証に時間をかけることが重要なのです。

 地方銀行のコンサル会社がツールを利用したところ、「その他家族が2人以上の家庭は、融資の金額が極端に少ない」という仮説が出てきました。つまり、祖父と祖母が健在な家は、お金を借りないということです。特に銀行の場合は最近まで個人情報を持っていませんでした。NISA(少額投資非課税制度)で初めて情報を手に入れたわけです。それで細かい分析もできるようになりました。

――DataDiverと同じような機能を持つ他社製品はあるのか。

 プログラミングが不要で、日本語のマニュアルがあるのはDataDiverだけと自負しています。基本的に、マーケターがツールに触ることを前提としていますので、使いやすく、ひらめきを与えられるように工夫しており、UIに力を入れています。

 また、統計的に異常な値(外れ値)を排除し、条件を整えて分析する下準備をします。

 ある薬が効かないというとき、薬を飲んだ人と飲んでいない人のデータを100人ずつ入れたとします。無作為にデータを入れると偏りが出ます。女性が多いとか、年齢層が違うとか、病歴を考慮していないなどです。条件をそろえて初めて、その薬が効くかどうかがわかるわけです。DataDiverでは、そういう前提条件をそろえて分析の手順を整えてくれます。

 これは「エビデンスベースドメディシン」と呼ばれる、統計の数値をベースにした医学であり、データに基づいた意志決定が広がっていることを示唆しています。広告宣伝などでも費用対効果がわかるため、失敗した場合、担当者の責任問題になるようなこともおきてきています。

 そういう意味では、DataDiverはCIO(最高情報責任者)よりもCMO(最高マーケティング責任者)に使ってもらえるといいなと思っています。たとえばCMO、マーケターの方が分析データを欲しいと言うと、1カ月かかる上に100万円もかかるというような場合もあります。情報システム部がデータ抽出をする際、自分で手を動かさず、外注するケースです。受注先は下請けに発注して、データを整形して渡すのに1カ月の時間に加え、100万円がかかるというのですが、1カ月前のデータをもらっても仕方ないと考えるマーケターもいるのではないでしょうか。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    「デジタル・フォレンジック」から始まるセキュリティ災禍論--活用したいIT業界の防災マニュアル

  2. 運用管理

    「無線LANがつながらない」という問い合わせにAIで対応、トラブル解決の切り札とは

  3. 運用管理

    Oracle DatabaseのAzure移行時におけるポイント、移行前に確認しておきたい障害対策

  4. 運用管理

    Google Chrome ブラウザ がセキュリティを強化、ゼロトラスト移行で高まるブラウザの重要性

  5. ビジネスアプリケーション

    技術進化でさらに発展するデータサイエンス/アナリティクス、最新の6大トレンドを解説

ZDNET Japan クイックポール

注目している大規模言語モデル(LLM)を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]