データ分析の民主化が進んでいる:データビークル油野CEO

吉澤亨史 山田竜司 (編集部) 2016年01月14日 12時00分

  • このエントリーをはてなブックマークに追加

 データビークルは、「誰もがビッグデータの価値を引き出せる世界を実現する」ことを目的に設立されたデータサイエンス専門企業。2015年12月には電通デジタル・ホールディングスからの出資が発表されるなど、注目が集まっている。IT業界での営業経験が豊富な油野達也氏が代表取締役で最高経営責任者(CEO)を務め、『統計学が最強の学問である』の著者である西内啓氏が取締役で製品の責任者に、個人投資家である山本一郎氏が取締役で最高財務責任者(CFO)に就任して脇を固めるという。今回は、同社の取り組みや特徴、今後について、油野氏に話を聞いた。

――データビークルとはどんな企業か。その成り立ちは。

 データを分析する際に“どんな項目同士をかけ合わせれば知見が導き出せそうか”を調べるためのツールを販売しています。所属していたベンチャーが上場した時のことです。投資家の山本から私に紹介があったのが、統計家の西内が作ったデータ分析ソフトでした。ソフトはコンセプトや機能は面白いものの、ユーザーインターフェース(UI)などが整っておらず、あれこれ相談しているうちに私もジョインすることになりました。


データビークル 代表取締役CEO 油野達也氏

 ソフトは西内がデータ分析に関連する本を出した関係で、データ分析で失敗している企業をコンサルティングしながら、「自分がやってる機械的な作業をプログラムにしてしまえば良い」と考えながら構想したものといいます。統計が専門である西内にはビジネスや実業務などの分析結果から何が正解かを判断するのは難しいが、依頼者から正解を引き出すことはできると。(知見を導き出すための)依頼者と統計学者のキャッチボールの手法を研修で教示した後、RやSQLで作ったプログラムをパッケージにしたら上手く行くのではと考えたそうです。

――そして完成したのがSaaSの分析ツール「DataDiver」。これはどのような製品か。

 ビジネスインテリジェンス(BI)ソフトでの分析を援助するためのツールです。BIツールでは、分析するときに対象となる項目を決めます。仮説を立ててさまざまな項目同士の相関を探していくのですが、関連性のわかるグラフをいくつか作成するだけでに何カ月もかかってしまうこともあります。大量のデータを用意して、データを分析できる形に整形し、プログラミングするためです。

 BIツールを使いこなすには仮説をいかにうまくたてるか、どんな項目同士を掛け合わせるかわかることが重要です。DataDiverは、その仮説を立てる製品です。

 データを全部入れて、その後にアウトカム(成果)、たとえば来店数が多いとか、ウェブの滞在時間の長さなどの説明変数を探すのです。そうすると、たとえば年齢や家族構成など、仮説を表示してくれます。仮説が分かれば、それでBIツールで分析します。

 BIツールだけで仮説と検証をくり返しても、いつまで経っても回答が出ません。たとえコンサルタントを入れても、誰でも推測できるような結果が出てきても成果はうすい。「携帯電話の解約率が最も高いのは、(違約金のない)購入から24カ月後」といった回答では成果がみえない。仮説の検証に時間をかけることが重要なのです。

 地方銀行のコンサル会社がツールを利用したところ、「その他家族が2人以上の家庭は、融資の金額が極端に少ない」という仮説が出てきました。つまり、祖父と祖母が健在な家は、お金を借りないということです。特に銀行の場合は最近まで個人情報を持っていませんでした。NISA(少額投資非課税制度)で初めて情報を手に入れたわけです。それで細かい分析もできるようになりました。

――DataDiverと同じような機能を持つ他社製品はあるのか。

 プログラミングが不要で、日本語のマニュアルがあるのはDataDiverだけと自負しています。基本的に、マーケターがツールに触ることを前提としていますので、使いやすく、ひらめきを与えられるように工夫しており、UIに力を入れています。

 また、統計的に異常な値(外れ値)を排除し、条件を整えて分析する下準備をします。

 ある薬が効かないというとき、薬を飲んだ人と飲んでいない人のデータを100人ずつ入れたとします。無作為にデータを入れると偏りが出ます。女性が多いとか、年齢層が違うとか、病歴を考慮していないなどです。条件をそろえて初めて、その薬が効くかどうかがわかるわけです。DataDiverでは、そういう前提条件をそろえて分析の手順を整えてくれます。

 これは「エビデンスベースドメディシン」と呼ばれる、統計の数値をベースにした医学であり、データに基づいた意志決定が広がっていることを示唆しています。広告宣伝などでも費用対効果がわかるため、失敗した場合、担当者の責任問題になるようなこともおきてきています。

 そういう意味では、DataDiverはCIO(最高情報責任者)よりもCMO(最高マーケティング責任者)に使ってもらえるといいなと思っています。たとえばCMO、マーケターの方が分析データを欲しいと言うと、1カ月かかる上に100万円もかかるというような場合もあります。情報システム部がデータ抽出をする際、自分で手を動かさず、外注するケースです。受注先は下請けに発注して、データを整形して渡すのに1カ月の時間に加え、100万円がかかるというのですが、1カ月前のデータをもらっても仕方ないと考えるマーケターもいるのではないでしょうか。

  • このエントリーをはてなブックマークに追加

関連ホワイトペーパー

SpecialPR

連載

CIO
研究現場から見たAI
ITは「ひみつ道具」の夢を見る
内製化とユーザー体験の関係
米ZDNet編集長Larryの独り言
今週の明言
「プロジェクトマネジメント」の解き方
田中克己「2020年のIT企業」
松岡功「一言もの申す」
林 雅之「デジタル未来からの手紙」
谷川耕一「エンプラITならこれは知っとけ」
Fintechの正体
内山悟志「IT部門はどこに向かうのか」
情報通信技術の新しい使い方
三国大洋のスクラップブック
大河原克行のエンプラ徒然
コミュニケーション
情報系システム最適化
モバイル
通信のゆくえを追う
セキュリティ
セキュリティの論点
ネットワークセキュリティ
スペシャル
座談会@ZDNet
Dr.津田のクラウドトップガン対談
CSIRT座談会--バンダイナムコや大成建設、DeNAに聞く
創造的破壊を--次世代SIer座談会
企業決算を追う
「SD-WAN」の現在
展望2017
IBM World of Watson
de:code
Sapphire Now
VMworld
Microsoft WPC
HPE Discover
Oracle OpenWorld
Dell EMC World
AWS re:Invent
PTC LiveWorx
古賀政純「Dockerがもたらすビジネス変革」
さとうなおきの「週刊Azureなう」
誰もが開発者になる時代 ~業務システム開発の現場を行く~
中国ビジネス四方山話
より賢く活用するためのOSS最新動向
「Windows 10」法人導入の手引き
Windows Server 2003サポート終了へ秒読み
米株式動向
実践ビッグデータ
日本株展望
ベトナムでビジネス
アジアのIT
10の事情
エンタープライズトレンド
クラウドと仮想化