Amazon Web Services(AWS)は米国時間7月9日、オンラインでのパネルディスカッションを開催し、同社のクラウドインフラが新型コロナウイルス感染症(COVID-19)への対応として、アウトブレイク(爆発的感染)の予測からワクチンの開発に至るまでのさまざまな面でどのように支援しているのかに光を当てた。
COVID-19のアウトブレイクは、中国を皮切りに世界各地に急速に広まり、パンデミックが宣言されるまでになった。こういったなか、世界中の臨床研究者や、バイオテクノロジー企業、製薬会社の果たす役割が大きくなってきている。この分野における主要な役割の担い手にとって、COVID-19のパンデミックはデータ面で大きな課題になるとともに、クラウドテクノロジーの重要なケーススタディになっていると言える。
AWSの顧客であるBlueDotやLifebit、AbCellera、Moderna、UC San Diego Health、BabylonはCOVID-19のパンデミックの最中にあって、イノベーションのペースや開発のタイムラインを加速させるとともに、成果の質を向上させるための支援を提供するという目的でさまざまなクラウドテクノロジーを用いている。
世界的な監視
カナダのトロントに拠点を置くBlueDotは、COVID-19のパンデミックに関連する傾向や兆候を洗い出すために、世界のさまざまな医療関係出版物から収集したデータに、AWSの機械学習(ML)を適用している。その目的は、ビッグデータやアナリティクスを活用し、世界各地のアウトブレイクを迅速に検知し、アウトブレイクがどのように広がっていく可能性があるかとともに、その影響を予想することだ。
BlueDotの共同創業者であり、最高経営責任者(CEO)でもあるKamran Khan氏は自らのキャリアを語るなかで、2003年のSARSコロナウイルス(SARS-CoV)のアウトブレイクを皮切りに、そのほとんどは新しい感染症がもたらす影響の研究だったと述べた。Khan氏は、世界の科学者や研究者と同様に、感染症の早期警戒システムの必要性を訴えかけている。
Khan氏は「われわれはSARSのアウトブレイク時に、公的な健康関連機関からの公式な報告を待っていては、情報を適時に入手できない場合があるということも学んだ」と述べ、「当社のデータサイエンティストやエンジニア、臨床医らは、150を超える疾病や症候群について、65にわたる言語のソースから情報を収集するプラットフォームを構築してきており、そのような情報を毎日24時間、15分毎に収集している。こういった部分で自然言語処理(NLP)やMLが重要になる」と続けた。
同氏によると、BlueDotはAWSのNLPやMLを用いて、場所や日時、ケース数や死者数などのコンテキストデータを含む、さまざまな病原菌に関する情報を抽出しているという。最終的な目標は、この非構造化テキストデータを、時間と空間、そして判明した病原体の名前を保持したかたちで組織化された、病原体の時空間的解析を可能にする構造化データへと変換することだ。
「われわれはこのプラットフォームを用いて、中国語の記事を翻訳し、注意を払うべき脅威をわれわれのチームに提示するようにした結果、2019年12月31日の朝に、武漢で肺炎のアウトブレイクが発生したというニュースを捕捉できた」(Khan氏)
BlueDotは1月初旬までに、武漢の新型ウイルスに起因するウイルスの拡散やアウトブレイクというリスクが高いと予想される都市を明らかにした研究結果を医学雑誌に寄稿した。同社は現在も、今後の大規模なアウトブレイクの検知に注力し続けている。