Facebookのディープラーニングフレームワークである「PyTorch」は、数年前にリリースされて以来、Elon Musk氏の自動運転車やロボット農場プロジェクトなど、さまざまな用途に使用されてきた。
さらに製薬大手AstraZenecaは、社内のエンジニアチームが、PyTorchを使用した創薬の簡素化とスピードアップを図っていることを明らかにしている。
AstraZenecaの技術は、PyTorchと「Microsoft Azure Machine Learning」を組み合わせて使用することで、大量のデータを処理して、薬、疾患、遺伝子、タンパク質、分子などの間にある複雑なつながりに関する、新たな知見を獲得するものだ。
それらの知見は、研究者が実験室で試験を行う創薬ターゲットを推奨するアルゴリズムの構築に利用されている。
この手法は、創薬などの分野に大きな進歩をもたらす可能性がある。創薬の分野ではこれまで、経費が高く時間もかかる、試行錯誤を繰り返す手法が使われてきた。
通常、特定の疾患に有効な新薬を開発するためには、有効な解決策が見つかるまで、実験室でさまざまなタンパク質の設計やその組み合わせの試験を行う必要がある。この過程に時間がかかるため、薬に関するアイデアが生まれてから、実際にその薬が世に出るまでには、10~15年かかることもある。一方、AstraZenecaのアルゴリズムは、特定の疾病の治療に関して有望な、研究者が優先的に試験するべき創薬標的のトップ10をずっと短時間で特定することができる。
研究者が研究を進めるためにアクセス可能なデータの量は、毎年指数関数的に増加しているため、創薬に自動化を導入することは極めて有用だ。日々大きくなるデータベースを分析して、それらの情報が創薬にどう役立つかを理解する作業は、人間の能力を超えている。
AstraZenecaの機械学習エンジニアであるGavin Edwards氏は、米ZDNetの取材に対して、「研究者が利用できる科学情報やデータの量は、毎年大幅に増加している。PyTorchなどのAIや機械学習のためのツールやAzureを利用することで、複数の情報源から得た情報を素早く抽出し、組み合わせて、解釈することができる。その狙いは、同じデータを手動で分析するよりも短時間で、優れた科学的な結論を引き出すことだ」と述べた。
利用可能なデータの多くは構造化されていない情報であり、そこにPyTorchの出番がある。PyTorchは、プログラミング言語のPythonをベースとするFacebookが開発したオープンソースの機械学習ライブラリーであり、特にコンピュータービジョンや自然言語処理のような分野の、膨大な量のデータサイエンスの処理を行うのに向いている。