機械学習によって構築された人工知能(AI)の医療への応用を妨げているのは、モデルの訓練に使用する医療情報が秘密を要することだ。
提供:JGI/Tom Grill/Getty Images
しかし、「連合学習」と呼ばれる新たな取り組みは、データの秘密を守りつつ、アルゴリズムの開発者と臨床医の両方が、実際のデータセットと機械学習モデルの相互作用による恩恵を受けることを可能にする。
そのデータの行き詰まりの問題を解決しようとしているのが、医療AIのベンチマーキングフレームワークである「MedPerf」だ。MedPerfは、プロセッサーがAIタスクを実行する際のパフォーマンスを計測するベンチマークを行っている非営利業界コンソーシアム「MLCommons Association」が進めている取り組みであり、その内容を紹介する論文が米国時間7月17日、権威があることで知られる学術誌出版会社「Nature」の系列論文誌に掲載された。
提供:MLCommons
MedPerfのベンチマークは、AIモデル自体をデータを保持している臨床医のところに送り、臨床医が手元にあるデータを使ってモデルを実行して、その結果を報告するという仕組みになっている。この仕組みを採用することで、AIの開発者が、通常であれば決してアクセスできないはずの非公開のデータセットにアクセスすることが可能になる。また、臨床医側も、データに基づいて推論を実行することで、AIから患者の健康に関する知見を得られるかどうかを知ることができる。このやりとりの間に、データが臨床医がいる安全な施設の外に出ることはない。
Natureの論文誌の1つである「Nature Machine Intelligence」に掲載された論文「Federated benchmarking of medical artificial intelligence with MedPerf(MedPerfを用いた医療AIの連合ベンチマーキング)」では、「このアプローチは、医療AIの普及を促進するとともに、より効率的で再現性が高く、費用対効果の高い臨床診療を実現し、最終的に患者の転帰を改善することを目的としている」と述べている。
この論文の第一著者は仏ストラスブール大学のAlexandros Karargyris氏で、そのほかにも、プロジェクトの参加者として、5つの大陸の13の国から、NVIDIAやMicrosoftを含む20社以上の企業と、20組織の学術機関の代表者76人が論文に名を連ねている。
MedPerfをベンチマークのテストケースとして最初に使用したのは放射線科と外科だった。しかし論文では、このプラットフォームは「デジタル病理学、ゲノム学、自然言語処理(NLP)、カルテの構造化データの利用などのその他の生物医学的タスクでも簡単に利用できる」と述べている。
MLCommonsのウェブサイトに掲載されている概略図と、それに付随するブログ記事で、このアプローチの要点が説明されている。
MLCommonsのエグゼクティブディレクターを務めるDavid Kanter氏は電子メールで、「医療AIは、地球上のすべての人に影響を与える可能性のある不可欠な技術であり、私は、研究者や病院、技術者など、MedPerfに対して幅広いコミュニティーが関与してくれていることを非常に誇りに思う」と述べた。
「MedPerfはコミュニティーによる大きな取り組みであり、この取り組みが成長して、活気を帯び、最後にはあらゆる人々の医療の改善につながることを楽しみにしている」(Kanter氏)