Amazonの人工知能(AI)担当バイスプレジデントSwami Sivasubramanian氏は米国時間12月8日、オンラインで開催されており、2週目となる「re:Invent 2020」で機械学習をテーマとした基調講演を行った。
Sivasubramanian氏は講演の中で、同社の機械学習ミドルウェアプラットフォームである「SageMaker」で、大規模なニューラルネットを自動的にパーツに分解し、複数のコンピューターに分散する機能を提供することを明らかにした。通常であれば、「モデル並列性」とも呼ばれるこの形態の並列処理を実現するには、かなりの労力が必要になる。
この新機能は、専門的な開発スキルを持つ一部のサイエンティストだけでなく、多くの人に機械学習を(大規模な深層学習モデルまで含めて)利用できるものにするというテーマの一環だと同氏は語った。
Amazon SageMakerの「Data Parallelism」エンジンを利用する分散トレーニングによって、非常に大規模なディープラーニングネットワークの平均トレーニング時間を40%削減できると同氏は説明した。
Sivasubramanian氏はそのほかにも、同様のテーマの新機能として、機械学習モデルのためのデータを簡単に準備できるようにする機能である「SageMaker Data Wrangler」や、機械学習モデルのバイアスを検出するための機能である「SageMaker Clarify」を発表した。
また、2019年に発表された「SageMaker Debugger」に、深層学習トレーニングのリソース使用効率を改善するための機能が追加されることも明らかになった。この新機能は「Deep Profiling for Amazon SageMaker Debugger」と呼ばれるもので、トレーニングで使用されているGPUやメモリーなどのリソースの使用状況を可視化する機能や、リソースの使用状況を最適化するための調整事項を推奨する機能、処理のどのフェーズで時間がかかっているかを分析する機能などを持っている。
また、多数のエッジデバイスに導入される機械学習モデルを最適化したり、監視したりする機能である「SageMaker Edge Manager」も発表された。この機能を利用すれば、シンプルなダッシュボードを通じて、フリート中の各デバイスで実行されているモデルのパフォーマンスを把握することができる。
またSivasubramanian氏は、より多くの「ビルダー」が機械学習を利用できるようにするというテーマに沿って、2019年に導入された「SageMaker Autopilot」の機能を応用していると語った。SageMaker Autopilotでは、機械学習に詳しくない人が、自動化のアプローチを使用してモデル作成を行うことができる。
Sivasubramanian氏は講演の中で、「しかし、もしモデルを選ぶ必要自体がなかったらどうだろうか?」と問いかけた。この質問に対するAWSの回答は、Amazonのデータウェアハウスサービスである「RedShift」でAutopilotの機能を活用するというものだった。この新たな機能は「RedShift ML」と呼ばれるもので、ユーザーはデータベースに対してSQLクエリーを実行し、機械学習モデルを構築しなくても機械学習による推論を行うことができるという。
また同氏は、「Amazon Aurora」で機械学習を使用できるようにしたのと同じような形で、グラフデータベースサービスである「Amazon Neptune」に、グラフ向けの機械学習機能を追加することを明らかにした。「Amazon Neptune ML」が提供される。
Sivasubramanian氏が語ったMLを大衆化するためのもう1つの要素は、機械学習を目の前のビジネス課題に適用する方法を見つけることだった。このテーマに関して、メトリックの異常検知と根本原因分析を提供するサービスである「Amazon Lookout for Metrics」が発表された。このソフトウェアは、さまざまなアプリケーションに対して自動的にデータマイニングを行い、異常を検知する。
また、同様のサービスとして、製造業の組み立てラインで欠陥品の検出を行うサービスである「Lookout for Vision」も発表されている。
この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。