Watsonが一般的ながん専門医に役立つアドバイスをできるようになるには、より幅広いがん患者のデータが必要だ、とChin氏は言う。
「わたしたちが気づいたのは、もっとデータが必要だということだ。MDアンダーソンがんセンターや、メモリアルスローンケタリングがんセンターのような専門病院を訪れるに至る患者は、全体の2%に過ぎない。わたしたちは、残り98%の患者を代表するデータをもっと必要としている」
同センターは、PricewaterhouseCoopersのコンサルタントと協力し、Watsonのアドバイスを改善するための、新しいデータ源を見つけようとしている。Chin氏は、将来は多くのさまざまな病院、診療所、薬局などからデータを収集するとともに、腕に着ける活動量計である「FitBit」などの、自宅での患者の活動に関する情報を提供するデバイスのデータも手に入れたいと考えている。
「これは、病院や診療所からだけではなく、実社会環境からも安全にデータを収集できる手段が必要だということだ」(Chin氏)
システムには幅広い専門性は期待できない
Watsonやその他の機械学習システムに、ある職業に必要な一般的な専門性を持たせようとすると、その職業に関係がある複数の領域の知識を理解できる必要が出てくる。
例えば、医療の場合であれば、医者はがんから糖尿病に至るまで、多くの異なる病気を理解している必要があるし、肺がんや脳腫瘍などのより狭い領域の専門についても理解しなくてはならない。
ところが、システムをトレーニングして、数多くある狭い領域をひとつひとつ理解させることは、困難で時間が掛かる仕事だ。同センターの初期の取り組みで、白血病や肺がんなどの特定の種類のがんだけに取り組んだのは、これが理由だった。
「自分が患者だと考えてみてほしい。わたしなら、がんしか知らない医者には診てほしくない。わたしは、医者に自分の高血圧や糖尿病についても知っていてほしい。そして、患者がそれらの病気をすべて持っている可能性もある。では、医者が患者を総合的に診察できるようにするため、その医者を支援する複数のエキスパートシステムを作るにはどうしたらいいだろうか?」とChin氏は言う。
「そこにたどり着くために必要なのは、それぞれの専門の壁を打ち破ることができる、共通のインフラだ」
専門的アドバイスができるまでトレーニングするには数カ月から数年かかる
たとえ、ある仕事に関係する1つの領域だけに限定した場合でも、Watsonをトレーニングして、専門的なアドバイスができるようにするプロセスには時間がかかる。
「1つの領域に対するトレーニングには、6カ月、9カ月、あるいは18カ月という時間がかかる。どれだけ時間がかかるかは、その領域の複雑さと、持っているデータの量に依存する」とChin氏は述べ、トレーニングは取り組みを進みながら考えていく必要があるプロセスだと付け加えた。
「トレーニングには常に要件がある。私たちがやっていることは、飛行機を飛ばしながら、その飛行機のエンジンの作り方を学ぼうとするのに似ている。不確定要素が非常に多い」
Telsa Consultancy ServicesのチーフサイエンティストHarrick Vin氏は、Watsonなどの機械学習システムのトレーニングに長い時間がかかることが、企業への普及の妨げになっていると述べている。特に、領域ごとに時間がかかるトレーニング手順を繰り返す必要があるとすればなおさらだ。
「本当に予想されているようなメリットを享受するには、1つのタスクを行うエンジンのトレーニングに、6カ月、1年、18カ月といった長い時間をかけずに済む方法を見つける必要がある。なぜなら、一般的な大企業は、少なくとも数百単位の活動を行っているからだ」と同氏は述べている。
ただしChin氏は、最初に手探りで長期間トレーニングを行う必要があるとしても、必ずしもこのテクノロジが大規模に利用できないとは考えていない。同氏は、トレーニングのプロセスや、異なる専門領域の扱い方に関する知識が成熟するに従って、トレーニングにかかる時間は短くなっていくはずだと指摘している。