データ連携周りは、まずERPを“マスター of マスター”としつつ、データ連携を使って各システムにデータを配信していくことを基本的な構想として始めた。正しい情報が必ずどこかに1つあり、それを“標準化された通路”で各システムに配布するという形を作りたかったという。Workdayに入力された従業員マスターのデータが各システムに送られる形になっている。
図6
ここでは、クラウド系のシステムごとにマスターデータの持ち方や設計思想が微妙に違うことから、そのままデータを流せばいいというわけではない点に注意が必要だという。詳しい構成は図6の通りだが、Informaticaの部分でデータの変換や設計を工夫している。例外的にパートナーとworkdayをつなぐ部分はInformaticaを経由せず直接行っている。Microsoft AzureのActive Directory(AD)やIDM(ID Management)も基本的には従業員が入社してからWorkdayにデータが登録されると、ADなどに情報が追加されるという、非常にオーソドックスな構成となっている。
反省と展望
中野氏は、今後「アプリの疎結合化」と「データ活用」を目指している。アプリの疎結合化(図7)は、最初のシステム構成の反省を踏まえたものだという。「各アプリケーションはInformaticaを介してつないでいるが、Informaticaの中ではデータベース同士を直につないでいるので、何か問題があれば即刻下流に影響する。運用負荷が極めて高まるので、そこは最初からデータハブを介して配信するという形にすべきだった」(中野氏)
図7
またデータ活用について、クックパッドは以前からAmazon Web Services(AWS)を利用しているといい、例えばデータウェアハウス(DWH)ではAmazon Redshiftに同社のサービス系情報を蓄積しているという。従来はサービス系のデータだけだったが、現在では社内システム系のデータもRedshiftに蓄積し始めている。
「データ活用は、DWHへひたすらデータを入れれば活用できるわけではなく、活用のための環境整備も必要。ここではTableauは全社展開している。全社員分のアカウントを確保して、BIとDWHの道具立てはできている」(中野氏)
エンジニアは、データソースがあれば自身でTableauを使って分析できるという。しかしエンジニア以外の従業員にとって、そもそも「どのデータがどこにあって、それはどういう意味なのか」ということを解釈することが非常に難しいという。そのためのデータカタログを全て手作業で用意にするには、多くの時間と労力が必要になることから、そこをどううまく整備するかも課題になっている。
「いまはRedshiftにデータを全て入れるところから着手した状態で、“データドリブンの下ごしらえ”みたいな部分。今後は、クラウドに対応するデータ連携の仕組みも活用していきたい」と話している。