Microsoftは、機械学習の技術をめぐる競争が激化する中、同社の深層学習ツールキット「Computational Network Toolkit」(CNTK)をオープンソースとしてさらに広く利用できるようにする。
CNTKはもともと、同社が運営する「CodePlex」のサイトで2015年4月にアカデミックライセンスで公開されたものだが、同社は今回このツールを、世界最大のコードホスティングサイトであるGitHubに移した。同時に、CNTKのライセンスは、より許容度が高いMITライセンスに切り替えられている。
同社はこれらの取り組みによって、CNTKに幅広い開発者が参加するコミュニティが生まれることを望んでいる。同社は、今回の変更について発表する公式ブログ記事で、CNTKの背景についても若干触れている。
Microsoftで音声科学の責任者を務めるXuedong Huang氏によれば、同氏のチームはコンピュータの音声認識機能の改善をスピードアップしたいと考えていたが、使っていたツールが原因で取り組みが遅れていた。
このため、有志のメンバーが集まって、何よりも性能を重視したソリューションを作り出すことで、自らこの問題を解決することにした。
Huang氏によれば、社内でテストしたところ、CNTKは開発者が音声認識や画像認識などの深層学習モデルの構築によく用いている他の4つのツールキットよりも、効率が高いことが証明された。これは、CNTKの通信機能が優れているためだ。
Huang氏は「とにかく、CNTKはこれまでに見たどんなものよりも、はるかに効率的だ」と述べている。
この種の性能向上は、動きの速い深層学習の分野では極めて重要だ。大きな深層学習のタスクには、完了するまで数週間かかるものもあるためだ。
このツールキットを手掛けたMicrosoftのプリンシパルディベロップメントマネージャーChris Basoglu氏によれば、CNTKが優れている点の1つは、コンピュータを1台しか持っていない予算の限られた研究者から、GPUベースのコンピュータを使った巨大なクラスタを構築できるような人まで、誰でも使えることだ。
CNTKは一般に利用できるほかのツールキットよりも多くのGPUベースのマシンを使用することが可能で、これは大規模な実験や計算を行いたいユーザーにとっては重要な利点だとMicrosoftの研究者は話している。
ここで言う「一般に利用できる他のツールキット」には、2015年にオープンソース化されたGoogleの「TensorFlow」も含まれる。また、IBMやBaidu(バイドゥ)、その他の企業も、機械学習ツールキットをオープンソースとして提供している。