昨今、非構造化データをビッグデータとして活用、分析することがバズワードのように扱われている。構造化データの分析などの処理の際、前過程として必要となるデータの統合や整形などツールの開発、販売を手がける米Informaticaの最高経営責任者(CEO)Anil Chakravarthy氏が来日、インタビューに応じた。
Informaticaは2015年8月に投資会社などによる買収によって非公開企業となり、2016年1月の買収時に最高製品責任者(CPO)からActingCEOに昇格したChakravarthy氏が正式にCEOに就任。同時に会長として元AdobeのCEOだったBruce Chizen氏、最高マーケティング責任者(CMO)としてSASで21年に渡りCMOなどを務めてきたベテランのJim Davis氏が就任した。
非公開企業としてトップ人事を一新し仕切り直したと言ってよいだろう。新たに開発が進むビッグデータ関連の製品やサービス、非公開企業としての状況、さらに将来のチャレンジなどを聞いた。
――現在のInfomaticaのビジネスの概要とは。
米Informatica CEO Anil Chakravarthy氏 元製品担当のエグゼクティブだけあって製品の概要に関して淀むことなく回答する姿は印象的だった
Informaticaはデータ管理製品の大きなシェアを持ち、エンタープライズの顧客に対してデータを活用するためのツールを提供しています。その中でもアナリティクス分野では金融機関でのリスク分析、不正の検知、その他の業界では顧客の分析などの事例があります。
特に顧客を360度の視点で理解するためのデータを提供することにも利用いただいています。これはさまざまなデータソースを活用して顧客の全ての側面、つまり360度の視点から理解を深めるという使い方になります。
データ管理ソリューションをもう少し分解すると、さまざまなソースのデータを統合するデータインテグレーション、データの品質を上げるためのデータクオリティ、マスターデータマネジメント、データセキュリティ、クラウドデータとの統合、ビッグデータなどに展開されます。
われわれの主な製品であるデータインテグレーション、つまりデータ連携にはふたつの側面があります。ひとつはETL(Extract、Transform、Loadの略でさまざまなデータをデータウェアハウスなどに格納するための処理)。2つめは古いバージョンのSAPなどのアプリやシステムを更新する際にデータを移行するためのオペレーショナルなデータインテグレーションです。どちらもInformaticaは提供しています。
われわれはETL製品のリーダーとして業界に認められていますが、それら以外にも非構造型のデータ、例えばマシンデータやソーシャルメディアなどから発生するデータなどを使いたいというリクエストがあります。つまり非構造化データと構造化データを複合的に扱うことが求められているのです。
事例としては、顧客にジェット旅客機のエンジンを製造しているメーカーのものがあります。エンジンから出てくるセンサデータを集めて分析し、それに対して定期保守のための規則という非常に明確なレギュレーションを組み合わせることで、「故障する前の保守」が可能になります。
また非常に大きなECで、ロイヤリティの高い顧客に対しより良いサービスを提供するために、われわれの「360度ビュー」を利用しソーシャルメディアデータを分析している事例もあります。そのようなビッグデータを処理する製品においてはHadoopやSparkなどのオープンソースのビッグデータツールを活用しています。