塩野義製薬は、ハイブリッドデータクラウドプラットフォーム「Cloudera Data Platform」(CDP)の利用を開始した。Clouderaが発表した。
CDPでは、各基幹システム領域で管理しているソースデータを、メタデータリネージとして集約管理することで、どこに何のデータがあるかや加工履歴などのデータの概略を把握できるようにする。
また、ビッグデータの特性である4つのV(Volume:量、Variety:多様性、Velocity:スピード、Veracity:正確性)に対応しており、ニーズドリブンかつルールに則してデータを蓄積できる。これにより、解析担当者へのデータへのアクセシビリティーを向上させ、仮説検証サイクルを加速させられる。
さらにIn-Database機能により、CDP内でデータ抽出と一次加工することで、解析と思考のサイクル高速化が可能となる。
塩野義製薬は、同プラットフォームをデータエンジニアの基幹システムとして、コンプライアンスを順守しながら効率的なデータ管理に取り組む。また、データサイエンティストと業務担当者がニーズに基づき自社の研究、開発、市販後のバリューチェーンを横断したデータ活用の推進とデータ駆動型のイノベーションを目指す。
同社はデータ駆動型イノベーションの実現には、社内におけるデータリテラシーの向上・強化、さらにはデータエンジニアやデータサイエンティストの育成・活躍にもつながる、安全に整理・管理された統合データベースが必須であると考えていた。
それらを可能にするシステムの要件として、構造化データや非構造化データといった社内外にある多種多様なデータを、プライバシー保護などのコンプライアンスを順守しながら、ニーズに基づき集約・分析できることや、大容量データを高速に分散処理し、ビジネスインテリジェンス(BI)ツールや解析システムとシームレスに接続できるなど、他システムと連携しやすいことなどが挙げられていた。