Amazon Web Services(AWS)は、年次イベント「re:Invent 2021」の会期2日目となる12月2日、データや機械学習の利用機会の拡大を図る多数の新サービスを発表した。基調講演に登壇したAmazon 機械学習担当バイスプレジデントのSwami Sivasubramanian氏は、全てのデータタイプとワークロードに向けた包括的なデータ、アナリティクス、機械学習の“旅路”をAWSが提供していくと宣言した。
![Amazon 機械学習担当バイスプレジデントのSwami Sivasubramanian氏](/storage/2021/12/02/9ed203abbb861d30e71f9e30936d2554/aws_invd201.jpg)
Amazon 機械学習担当バイスプレジデントのSwami Sivasubramanian氏
現代社会は日々多種多様で膨大なデータが生成され、Sivasubramanian氏は、データから「情報」を取り出し価値につなげていくかが重要だと説く。現代のデータ活用では、「データ基盤の最新化」と「データ統合」を通じて「革新」を実現するというエンドツーエンドのデータ戦略が求められ、そこでは可用性や安定性、拡張性、コスト、セキュリティといったあらゆる要件を満たす環境が不可欠だと述べる。同社のデータベースやアナリティクス、機械学習関連のサービスを利用する企業は、世界で150万社以上だと明かす。
![Sivasubramanian氏の掲げたエンドツーエンドのデータ戦略](/storage/2021/12/02/277e4e318368ba9ce9d3881342ddea73/aws_invd202.jpg)
Sivasubramanian氏の掲げたエンドツーエンドのデータ戦略
講演でSivasubramanian氏は、まず「データ基盤の最新化」の文脈から、データ活用の根源となるデータベースについて触れた。ユーザーからは、データベースの性能に関する問題の声が寄せされ、例えばECサイトなら商品購入や決済などの処理が遅れ、ビジネスに影響が生じていると指摘する。これを解決する新サービスとして、「Amazon DevOps Guru for RDS」を発表した。
Amazon DevOps Guru for RDSは、2020年のre:Inventで発表したアプリケーションの性能問題を機械学習技術で検知、分析し、解決策をアドバイスするAmazon DevOps Guruをデータベースサービスに対応させたもので、データベースの性能に関する問題を自動的に検知、分析し、ユーザーに数分程度で解決策を提示するという。
![「Amazon DevOps Guru for RDS」サービス](/storage/2021/12/02/f5d27c0dc0efab3cf49336a45517c7fc/aws_invd203.jpg)
「Amazon DevOps Guru for RDS」サービス
また、データベースのセットアップや運用、スケーリングなどを自動化するマネージドサービスの「Amazon RDS Custom」では、「Oracle Database」に加えて「Microsoft SQL Server」にも対応を図った。ユーザーは、これらデータベースを利用するアプリケーション側にリソースを集中できるようになるとする。
この他に、アクセス頻度の低いデータの格納コストを最大60%削減するという「Amazon DynamoDB Standard-Infrequent Access Table Class」や、データベース移行支援では50万件以上の利用実績がある「AWS Database Migration Service」において、移行計画の調査や策定など自動化する「AWS Database Migration Service Fleet Advisor」を追加した。
続いて「データ統合」の文脈でSivasubramanian氏は、データレイクの「AWS Lake Formation」をはじめ、「S3」ストレージでクエリーを利用する「Amazon Athena」やビッグデータ処理の「Amazon EMR」、データウェアハウスの「Amazon Redshift」、ETL(データの抽出・加工・変換)ツールの「AWS Glue」など挙げつつ、データ統合のための機能やサービスを数年かけて拡充してきたと振り返った。
![あらゆるデータを集め、整え、活用していくための「データ統合」のステップにおけるAWSのサービス](/storage/2021/12/02/fa38f632cfeeb0ef18748a4f9b771883/aws_invd204.jpg)
あらゆるデータを集め、整え、活用していくための「データ統合」のステップにおけるAWSのサービス
これらによるデータ統合の基盤は、同氏が冒頭に挙げたエンドツーエンドのデータ戦略の最終ステップになる「革新」を実現する要素であり、これによって組織にデータドリブンの文化を醸成し、データに基づく意思決定を可能にしていくと説いた。この戦略の「革新」でその実現の中核を担うのが、機械学習の統合開発環境の「Amazon SageMaker」になる。
Amazon SageMakerは2017年のリリース以降、毎年のre:Inventで大規模なアップデートが発表されている。2021年のアップデートは、イベント初日に発表した「Amazon SageMaker Canvas」など、機械学習を日常業務で活用するライトユーザーを対象として、ユーザーのすそ野を広げるものが中心となっている。
まず機械学習を開発するための教師データなどの準備においては、アノテーションの際にユーザーが個々の目的に応じたデータラベリングのワークフローを容易に構築できる「Amazon SageMaker Ground Truth Plus」を加えた。
Amazon SageMaker Canvasは、機械学習モデルの構築の“民主化”を目的に、ローコードのコンセプトでビジネスアナリストがモデル構築を容易に行えるようにする。ここでは、Amazon EMRのクラスターに接続してApache SparkやHiveなどを活用したモデル開発ができるよう「Amazon SageMaker Studio Notebooks」の機能も強化している。
SageMakerの基盤自体も強化し、新たに3種類のサービス「Training Compiler」「Inference Recommender」「Serverless Inference」を追加した。Training Compilerは、学習に要する時間を最大50%削減し、Inference Recommenderではユーザーが目的とする推論を実行するための最適なAWSのインスタンスサービスを提案する。Serverless Inferenceは、推論実行時のコストを最適化する従量課金モデルとなる。
さらにSageMakerの新規利用を容易にする目的で、無償版サービスといえる「SageMaker Studio Lab」も発表した。AWSのアカウントを持たなくともメールアドレスとウェブブラウザーがあればSageMakerの主な機能を無料で使える。ユーザーには15GBのストレージと学習用として最大12時間分のCPU、同4時間分のGPUのリソースが提供され、開発した機械学習モデルをSageMaker Studioにそのまま展開できるという。
![「Amazon SageMaker」ではライトユーザー向けのCanvasと無償版のLabを新たに加えた](/storage/2021/12/02/ef99be84c51356ba678bc52870ec64aa/aws_invd205.jpg)
「Amazon SageMaker」ではライトユーザー向けのCanvasと無償版のLabを新たに加えた
この他にSivasubramanian氏は、人工知能(AI)関連の新サービスとして、機械学習を使った検索機能「Amazon Kendre」を拡張した「Amazon Kendre Experience Builder」、自然言語処理技術を活用してチャットボットを容易に開発できるとする「Amazon Lex Automated Chtabot Designer」を発表。後者は当初として英語のみに対応するが、クラウドコンタクトセンターサービスの「Amazon Connect」と連携することで、オペレーターと顧客の会話内容などを自動的に取りまとめ、必要なアクションをすぐに講じられるような活用シーンがあるという。
最後にSivasubramanian氏は、IntelおよびUdacityと機械学習ユーザーの育成を支援する「AWS AI&ML Scholarship Program」を展開することも明らかにした。AWSは2025年までに2900万人に機械学習の体験機会を提供するとしており、その一環の施策になる。プログラムでは年間1000万ドル規模の奨学金を2000人の学生に提供するほか、成績上位者には、AmazonとIntelの機械学習の専門家が支援を行う。
![AWSは2025年までに2900万人に機械学習を体験してもらう目標を掲げる](/storage/2021/12/02/ef0f68bbe1036b0e426c9896afe0cb35/aws_invd206.jpg)
AWSは2025年までに2900万人に機械学習を体験してもらう目標を掲げる
こうした取り組みでは他にも、50カ国以上の約300の大学などが参加するディープラーニング教材のオープンソースブロジェクト「Dive into Deep Learning」を展開。同じく自動車レースの形式で機械学習とIoTなどを学ぶ「Deepracer League」を展開していると説明した。