Intelとペンシルバニア大学は米国時間5月11日、29の医療機関および研究機関と協力し、脳腫瘍を検出できる人工知能(AI)モデルのトーレニングに取り組むと発表した。
脳腫瘍に関する過去最大のデータセットを使い、強力なモデルをトレーングする計画だ。プライバシーを保護する連合学習(Federated Learning)の手法を用いることで、参加組織は患者データを実際に共有することなく、データセットに貢献できる。
「脳腫瘍の早期発見において、AIは極めて有望だ。しかし、その潜在能力をフルに引き出すには、1つの医療センターが保有する以上のデータが必要だ」と、Intel Labsの主任エンジニアのJason Martin氏は発表の中で説明した。
医療アプリケーション向けに強力なニューラルネットワークをトレーニングするのは、容易なことではない。医療研究者は、患者情報のセキュリティーとプライバシーを保護しなければならないため、協業的な取り組みにデータをやすやすと提供できないからだ。そのため研究者が利用できるデータセットの規模は、おのずと限定されていた。
Googleが2017年に発表した連合学習は、分散データに基づいた学習パラダイムのため、こうした問題を回避できる。アルゴリズムモデルは、単一のデータプールに依存する代わりに、複数の拠点で反復的にトレーニングされる。これにより医療分野では、深層学習モデルのトレーニングのために、リソースを出し合いたい病院やその他の組織が、一定のプライバシーを確保できるようになる。実際にデータを共有したり、外部に持ち出す必要がないからだ。
Intelは2018年に、ペンシルバニア大学の生物医学画像コンピューティング・分析センターと協業を開始し、実際の医用画像の連合学習向けに、最初の概念実証アプリケーションを開発した。そして、連合学習によって深層学習モデルのトレーニングを行い、従来のデータ共有手法でトレーニングしたモデルと比べて99%の精度を実現できることを実証した。
今回の新しい取り組みはこの研究を発展させたもので、Intelのソフトウェアとハードウェアを使って、連合学習を実装する。同社は、モデルとデータのプライバシーをさらに強化できる方法を用いると述べている。
参加機関は米国、カナダ、英国、ドイツ、スイス、インドに拠点を置く。第1フェーズには、ペンシルバニア大学病院、セントルイス・ワシントン大学、ピッツバーグ大学医療センター、ヴァンダービルト大学、クイーンズ大学、ミュンヘン工科大学、ベルン大学、キングス・カレッジ・ロンドン、タタ記念病院などが参加する予定だ。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。