新たなビジネスチャンスの源泉として注目を集めるビッグデータには、データの品質向上が欠かせない。不正確なデータ分析を元にして判断すれば、企業として不適切なアクションになるし、顧客の信頼も得られないだろう。
そこで、あらためて重要視されているのが、確実にデータの品質を確保する仕組みとして、銀行・保険・証券など金融業で採用が進んでいる「データガバナンス」である。今回は、データの品質を向上させるデータガバナンスについて紹介する。
ゲームやソーシャルサービスにおける膨大なアクセスログの解析から、エンタープライズ分野における顧客行動やIoTデータの分析まで、新たなビジネス機会の源泉としてビッグデータの活用に注目が集まっている。これらの分野では、統計的な手法を駆使して、相関をグラフ化したり、将来の傾向を予測したりして、次のアクションに落とし込んでいく。そのために、信頼性の低い、意味のないデータが混ざっていても、ノイズとして処理していくことが少なくない。
一方で、膨大なデータを抱えながら、個々のデータの品質や信頼性を重要視する分野もある。そのひとつが、銀行・保険・証券といった金融分野である。顧客の行動履歴から財務指標・経営管理データまで、高い信頼性と説明責任が求められるのだ。一般企業についても、経営情報、セキュリティや個人情報の管理については、同様の対応が求められる機会が増えていくだろう。
そのためのアプローチが、確実にデータの品質を確保する仕組みを構築・運用する「データガバナンス」である。
企業における、データ品質に対する課題
日本IBM
アナリティクス事業部
テクニカルセールス
時光さや香氏
金融業だけでなく、企業は、膨大なデータを蓄積している。これらの大量のデータは、活用することで、初めて価値を生み出す資産といえる。しかし、膨大なコストをかけているにも関わらず、データの正確性が不十分なら、価値を生み出すことができなくなってしまう。 「データガバナンスとはデータを企業資産と考え、汚れているデータによって生じている問題を、統制によって解決しようとする考え方です。特に、金融業のお客様で採用が進んでいます」
このように説明してくれたのは、日本IBM アナリティクス事業部 テクニカルセールスの時光さや香氏である。
データガバナンスでは、単純にデータを蓄積する"データレイク"を構築するのではなく、そこから上質の価値を取り出すことができる"データの貯水池"(データリザヴァー)を整備することが大切だというのだ。
時光氏によれば、データガバナンスが注目を集めるのは、次のように3つの理由があるという。
1つ目の理由は、規制対応である。銀行業では、バーゼル銀行監督委員会が公表している「実効的なリスクデータ集計とリスク報告に関する諸原則」(BCBS239)において、データの流れの見える化や、組織内でデータ管理に必要な用語辞典を整備するといった対応が求められている。保険業では、保険検査マニュアルやソルベンシーII といった規制により、データの発生源を明確にするといった対応が求められている。
2つ目の理由は、意思決定と分析である。アナリティクスとビジネス・インテリジェンスの土台となるのは、信頼性の高い情報である。データの信頼性が低ければ、的確な判断やリスク評価を下すことができず、不適切なアクションを起こすことになる。また、ExcelやBIツールを使って集計・分析されたレポートは、どこからデータを入手したのか、正しいデータを使ったのかなどの点を検証できるのかといった課題もある。調査する人が変わると、どのように分析していたのか分からなくなるといった属人性も問題となるだろう。
3つ目の理由は、コストである。企業内のデータを体系的に管理する仕組みが整っていないと、たとえば、決算内容や月次処理で異常値を発見したとしても、どこに原因があるのか、どのように修正すればいいのか把握するのに、膨大な時間と手間がかかってしまうというのだ。
「金融業では、元々このような課題を感じており、規制をきっかけに改善していこうという企業が増えてきています」(時光氏)
ビッグデータを活用しようとする一般企業であっても、データの品質の問題は、統計的なデータ処理にとどまらないだろう。その源泉となるデータのプライバシー保護やセキュリティの観点から、制度やモラルのようなルール作りが進めば、個々のデータの管理やメンテナンス体制を整備する必要性が高まっていくだろう。