海外コメンタリー

AWSの機械学習は今--「Alexaにユーモアのセンスを与えられるか」との話題も

Tiernan Ray (Special to ZDNET.com) 翻訳校正: 石橋啓一郎

2021-06-14 06:30

 Amazon Web Services(AWS)は6月初旬、機械学習をテーマにしたカンファレンス「Machine Learning Summit」をオンラインで開催した。

Sivasubramanian氏

 基調講演では、AWSの人工知能(AI)・機械学習担当バイスプレジデントSwami Sivasubramanian氏、Alexa Shoppingの研究担当バイスプレジデントのYoelle Maarek氏、機械学習担当バイスプレジデントBratin Saha氏が講演を行い、ソフトウェア企業Intuitの最高データ責任者(CDO)であるAshok Srivastava氏もゲストとして登壇した。

 Sivasubramanian氏は講演の冒頭で、機械学習の分野では1日に論文が100本以上発表されているという統計を引用しつつ、この技術は世代を代表する「もっとも変化が激しい技術の1つ」だと語った。「今や機械学習は主流になりつつある」と同氏は言う。Sivasubramanian氏によれば、現在は大手製薬会社のRocheやThe New York Timesをはじめとして、10万社以上の顧客がAWSで機械学習を利用している。

 同氏は、AWSが機械学習関連のサービスを開発する際にはすべてにおいて「顧客を起点に考えている」と語り、その例をいくつか挙げた。最初に挙げた例は、「少ないデータからの学習」だ。機械学習が一般的になるにつれて、データを手に入れ、アノテーションを行う作業は「あまりにも面倒」になっていると同氏は言う。例えば、米プロフットボールリーグ(NFL)がアメフトの試合で撮影された膨大な量の動画資産のライブラリーを活用しようとした事例がこれにあたると説明した。また同氏は、創立80年のピザの会社が、品質維持のために、すべてのピザに乗せるチーズを同じ量にしようとした事例に言及した。このピザ会社は、AWSを利用してピザを検査するための画像処理システムを開発した。このソリューションに使われたのが、限られた数のサンプルで機械学習を行う「Few-Shot Learning」と呼ばれる技術だ。

 Sivasubramanian氏によれば、Few-Shot Learningは、「Amazon Rekognition」で顧客がデータに独自のラベリングを行う際に使用されている。例えばNFLは、動画の中に登場する選手やジャージに独自のラベルを割り当てているという。またAmazonの欠陥検査サービスである「Amazon Lookout for Vision」でもRekognitionが使用されている。

 AWSは、欠陥検査サービスを構築するにあたって、実際の工場で起こっている状況をサービスに反映させる必要があると考えた。このため、Lookout for Visionの開発チームは、実際に工場の環境を再現できる環境を作り、そこで実際に得られたデータにFew-Shot Learningのアプローチを適用することでサービスを構築したという。

 Sivasubramanian氏が次に示した例は、機械学習でぼやけたテキストや傾いたテキストなどの「不規則なテキスト」から意味を抽出する仕組みだった。当然ながら、そうした条件では読み取りの精度は大きく下がる。これは、例えば医師の手書きのメモを読み取らせるというような現実の利用場面では重要な問題だ。

 同氏は、テキストの最初の数文字から推測するという従来の言語モデルのアプローチでは、文脈情報が少ない場合には問題に突き当たると説明した。そこでAWSの開発チームは、「SCATTER」(Selective Context Attentional Scene Text Recognizer)と呼ばれる手法を編み出した。

 SCATTERの仕組みには、文字認識の処理に文脈情報と単なる視覚情報のどちらを利用するかを選択できるデコーダーが追加されており、これによってテキスト認識の精度が3.7%改善された。Sivasubramanian氏は、これは大きな改善だと強調した。また、この基調講演が行われた6月2日から、AWSの自動テキスト抽出サービスにSCATTERが導入されたことも明らかにされた。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    ChatGPTに関連する詐欺が大幅に増加、パロアルトの調査結果に見るマルウェアの現状

  2. セキュリティ

    迫るISMS新規格への移行期限--ISO/IEC27001改訂の意味と求められる対応策とは

  3. セキュリティ

    警察把握分だけで年間4000件発生、IPA10大脅威の常連「標的型攻撃」を正しく知る用語集

  4. セキュリティ

    いま製造業がランサムウェアに狙われている!その被害の実態と実施すべき対策について知る

  5. セキュリティ

    ランサムウェア攻撃に狙われる医療機関、今すぐ実践すべきセキュリティ対策とは?

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]