塩野義製薬は、国内製薬他社に先行してHadoop環境の研究活用に着手し、Hadoop対応製品を医薬品開発情報基盤として活用する研究プロジェクトを、SAS Institute Japanとともに発足させる。SAS Institute Japanが9月3日、発表した。
これまで塩野義製薬では、データマネジメント、統計解析業務プロセスの最適化とグローバルな統計解析システムの構築を通じて、社内における臨床試験データの標準化に取り組んできた。同社では新薬の開発や安全性の研究において蓄積されたデータを再活用することで開発効率の向上を目指す。加えて、さまざまなオープンデータを組み合わせることにより研究開発をさらなる推進しようとしていた。
しかし、既存のシステムでは処理能力に限界があり、大量データに対しての統計解析処理の効率性向上が急務となっていたことから、効率よく大量データを処理することが可能で、拡張性に優れた分散処理環境であるHadoopに着目し、システムを構築している。
本研究プロジェクトでは、SASのHadoop対応製品の1つである「SAS In-Memory Statistics for Hadoop」を活用する。ビッグデータとオープンデータ分析のさらなる効率化を目指し、幅広くHadoopを活用するために、使い慣れた分析基盤であるSASを使用してHadoop上で機械学習処理と統計解析を実施する。
今回採用したSASのインメモリ技術「SAS LASR Analytic Server」は、Hadoopクラスタ上でデータをメモリ上に保持した分散並列処理を実現するもの。従来のHadoopフレームワークでは課題のあった機械学習処理のパフォーマンスを向上させ、双方向の分析環境を提供する。また、複雑なプログラミング言語を使用する必要がないため、ユーザーは使い慣れた分析ツールを使ってデータから価値を導くことに専念できる。
プロジェクトが目指す主な目標は、以下の通り。
- 医薬品開発業務におけるビッグデータとオープンデータ活用に向けた、組織、業務プロセス、データ、システムなどの観点からの課題と改善機会の特定、ならびにアクションプランの立案
- 安全性シグナル検出ダッシュボード、医薬品間のネットワーク・メタアナリシスなど、ビッグデータ活用の組織内外での普及、定着化に向けたサンプルレポートの開発
- 医薬品開発業務への利用価値と利用容易性の観点からの各オープンデータの評価
一方、SASは医薬品開発情報基盤構築のためのアドバイザーとして同プロジェクトに参画。テスト評価環境の構築と技術支援、業務課題解決に向けたアドバイスなどのサポートを提供し、医薬品開発におけるHadoop利用の促進、ビッグデータとオープンデータ活用の新たなビジネスモデル構築、および大学、企業、病院など各種関係団体への貢献を目指す。そして今後も、さまざまな研究プロジェクトを通じて、医薬品開発における統計解析システムの革新を支援していくとしている。