IBM、深層学習のトレーニング性能で新記録

Stephanie Condon (ZDNet.com) 翻訳校正: 編集部 2017年08月09日 11時31分

  • このエントリーをはてなブックマークに追加

 IBM Researchは、数百基のGPUを効率よく使用する分散深層学習ソフトウェアを開発し、この分野の新記録を打ち立てた。

 この研究では、深層学習の分野で最も重要な課題の1つに取り組んでいる。ニューラルネットワークとデータセットの規模を大きくすれば学習結果は改善されるが、トレーニングにかかる時間も長くなってしまうという問題だ。深層学習ベースの大規模な人工知能モデルのトレーニングには、数日から数週間かかることも珍しくない。

 使用するGPUの数が増加し、GPU間の通信が必要になると、処理にかかる時間も長くなってしまう。実際、GPUが高速になるにつれて、問題は悪化している。GPUの処理速度が高速であるほど速く学習できるようになるが、従来のソフトウェアでは、GPU間の通信がそれに追いつけなかった。

 今回開発された分散深層学習ソフトウェアは、この問題を解決し、「TensorFlow」「Caffe」「Torch」「Chainer」などのよく利用されているオープンソースのコードを使用して、大規模なニューラルネットワークとデータセットを高い効率で処理することができるようにする。


 IBM Researchは、64台の「IBM Power System」に256基のGPUを搭載したシステムでCaffeを使用し、通信オーバーヘッドを低減することによって95%のスケーリング効率を達成した。従来のスケーリング効率の最高記録は、Facebook AI ResearchがCaffe2を使用したトレーニングで達成した90%弱だった。

 それに加えIBM Researchは、この新しいソフトウェアを使用することで、大規模なデータセット(「ImageNet-22k」の750万枚の画像データ)を使用してトレーニングしたニューラルネットワークで、画像認識率の新記録である33.8%を達成した。トレーニングに要した時間はわずか7時間だった。これまでの最高記録はMicrosoftが達成した29.8%で、このモデルのトレーニングには10日間かかっていたという。


Hillery Hunter氏(写真)が率いるIBMの科学者らが、深層学習におけるブレークスルーを達成した。
提供:IBM

 IBMフェローのHillery Hunter氏は、これだけの成果を達成することができたのは、数十台のサーバに搭載した数百基のGPUを利用する手法を採ったためだと説明している。

 Hunter氏は、「よく使われている深層学習のフレームワークでは、1台のサーバに多数のGPUを搭載することでスケールを拡大しているが、複数のGPUを搭載した多数のサーバを使用するフレームワークはあまり使われていない。具体的には、われわれのチーム(Minsik Cho氏、Uli Finkler氏、David Kung氏、およびその他の協力者)は、数十台のサーバに搭載された数百基のGPUアクセラレータを使用した、非常に大規模で複雑なコンピューティングタスクの並列処理を、自動化および最適化するソフトウェアとアルゴリズムを作成した」と述べている。

 IBMは、この深層学習のトレーニング効率改善によって、より正確な医療画像の分析や、音声認識技術の改善など、さまざまなAIの利用分野で進展が期待されると述べている。IBMは、同社の深層学習ソフトウェア配布パッケージ「PowerAI」のバージョン4で、このソフトウェアのテクニカルプレビューの提供を開始している。

この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。

  • このエントリーをはてなブックマークに追加

この記事を読んだ方に

関連ホワイトペーパー

SpecialPR

連載

CIO
ハードから読み解くITトレンド放談
大木豊成「仕事で使うアップルのトリセツ」
研究現場から見たAI
ITは「ひみつ道具」の夢を見る
内製化とユーザー体験の関係
米ZDNet編集長Larryの独り言
今週の明言
「プロジェクトマネジメント」の解き方
田中克己「2020年のIT企業」
松岡功「一言もの申す」
林 雅之「デジタル未来からの手紙」
谷川耕一「エンプラITならこれは知っとけ」
Fintechの正体
内山悟志「IT部門はどこに向かうのか」
情報通信技術の新しい使い方
三国大洋のスクラップブック
大河原克行のエンプラ徒然
コミュニケーション
情報系システム最適化
モバイル
通信のゆくえを追う
セキュリティ
企業セキュリティの歩き方
サイバーセキュリティ未来考
セキュリティの論点
ネットワークセキュリティ
スペシャル
Gartner Symposium
企業決算
ソフトウェア開発パラダイムの進化
座談会@ZDNet
Dr.津田のクラウドトップガン対談
CSIRT座談会--バンダイナムコや大成建設、DeNAに聞く
創造的破壊を--次世代SIer座談会
「SD-WAN」の現在
展望2017
IBM World of Watson
de:code
Sapphire Now
VMworld
Microsoft WPC
HPE Discover
Oracle OpenWorld
Dell EMC World
AWS re:Invent
AWS Summit
PTC LiveWorx
古賀政純「Dockerがもたらすビジネス変革」
さとうなおきの「週刊Azureなう」
誰もが開発者になる時代 ~業務システム開発の現場を行く~
中国ビジネス四方山話
より賢く活用するためのOSS最新動向
「Windows 10」法人導入の手引き
Windows Server 2003サポート終了へ秒読み
米株式動向
実践ビッグデータ
日本株展望
ベトナムでビジネス
アジアのIT
10の事情
エンタープライズトレンド
クラウドと仮想化