--Zoomdataと提携を結んだのはなぜですか。この提携から、Databricks Cloudユーザーはどんな恩恵を受けられるのですか。
Tavakoli氏:われわれの顧客の多くは、Zoomdataの顧客とユースケースが重なっています。顧客の多くは、データエンジニアやデータサイエンティストに強く依存している、典型的なアーリーアダプターです。それらの顧客のすべてが、大規模なBIウェアハウスコンポーネントを持っています。
しかし、これらの企業が次に考えるのは、どうすればより多くのユーザーが使えるように、そのコンポーネントをシンプルにできるかということです。Sparkで処理しているデータは持っているが、これを開発スキルを持っていないユーザーでも利用できるようにするには、どうしたらいいのか?
BI視覚化アプリケーションはこの目的に最適であり、Zoomdataは当社のクラウドとの相性が抜群であることがわかりました。
--DatabricksとZoomdataが共同で提供するサービスを利用する、一般的なユースケースの例を挙げてもらえますか。
Tavakoli氏:典型的なのは、広告技術業界でしょう。
広告技術の企業が持っている一般的な業務フローは、さまざまな情報源から入手したデータから社内データベースを構築し、これに対して徹底的にETLパイプラインを実行し、それを処理された形式に変換する、というものです。
その後、顧客からCRMとマーケティング自動化システムのデータが提供され、これをこの社内データベースと組み合わせて利用して、広告キャンペーンの有効性に関する疑問を解決します。データエンジニアやデータサイエンティストがこのプロセスを扱い、理論が検証されます。
一方で、データアナリストや製品マネージャーは、もっと高いレベルの疑問を解決したいと考えます。例えば、製品のどの機能が効果的かを知りたいこともあれば、モバイル広告の効果を知りたい場合もあるでしょう。この種のユーザーには、ZoomdataのようなBIインターフェースの方がずっと向いています。
ほかの例を挙げるとすれば、モノのインターネット(IoT)でしょう。例えばAutomatic Labsは、自動車内にある全デバイスの、すべてのデータを収集しています。データサイエンティストは、自動車、コスト、運転パターンと相関性のある潜在的なトレンドに関する詳細な分析を行います。
一方経理担当マネージャーのような専門家以外のユーザーは、保険料と相関性のあるデータを調べたいと思うかもしれません。これらのユーザーは、Sparkクラスタを立ち上げて、PythonやSQLのコードを書きたいとは思っていません。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。