米国立がん研究所(NCI)の研究者らは、Google Cloudのデータウェアハウス「Google BigQuery」を使用し、膨大な量のゲノムデータとプロテオミクスデータを迅速に解析している。そしてNCIは、そのツールやリソースをより広範な研究コミュニティーに提供するようになった。研究者らはクラウドを活用することで、救命に役立つがん研究を加速させながら、データのセキュリティを確保して、国内外の規制にも準拠したい考えだ。Googleが米国時間12月16日に明らかにした。
ここで言及しているデータは、NCI Cloud Resourcesの一部であるISB Cancer Gateway in the Cloud (ISB-CGC)から提供されたものになる。NCIは、科学者が非常に大きなデータセットをダウンロードして保存する必要がないように、Cloud Resourcesを実現した。
2人の研究者が、統計的テストを実施したり、乳がんをより全体的に把握したりするために、Google CloudでISB-CGCを使い、一連のBigQueryのユーザー定義関数(UDF)を作成した。BigQueryでUDFを使うことで、オンプレミスのプログラムでは数日かかる分析が、わずか数分で完了したという。
この2人(General Dynamics Information Technologyの生物情報学リードサイエンティストのKawther Abdilleh博士、ISBの上級科学研究員のBoris Aguilar博士)は、広範なコミュニティーで他の研究者が、BigQueryを介してUDFを利用できるようにした。
Abdilleh博士は、「クラウドがもたらす費用対効果を広めたい」と声明で述べた。「Google CloudのBigQueryにより、研究者が大量のデータを安価に、かつてないスピードで分析できることを実証できた」(同氏)
この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。