編集部からのお知らせ
記事まとめ「サードパーティークッキー問題」公開
記事まとめ読み:GIGAスクール

Facebook、画期的なAIモデル「SEER」を発表--10億枚のInstagram画像で学習

Daphne Leprince-Ringuet (ZDNet.com) 湯本牧子 吉武稔夫 (ガリレオ)

2021-03-05 11:14

 Facebookの研究チームは、インターネット上にあるラベル付けされていないランダムな画像グループから学習できる、新たな人工知能(AI)モデルを発表した。この画期的な成果は、まだ初期の段階とはいえ、コンピュータービジョンに「革命」をもたらすことになるとチームは期待している。

多様な画像
提供:Facebook AI

 「SEER(SElf-supERvised:自己教師あり)」と名付けられたこのモデルには、一般に公開されているInstagramの画像10億枚が与えられた。これらの画像は、それまで人手でキュレーション(整理)されたことがないものだ。しかし、一般にアルゴリズムの学習に使われるラベルや注釈がなくても、SEERは自律的にデータセットの内容を調べ、その過程で学習し、最終的にオブジェクト検出などのタスクでトップレベルの正確性を実現した。

 自己教師あり学習という相応しい名前が付けられたこの手法は、AIの分野ではすでに確立されており、その実体は与えられた情報から直接学習できるシステムの開発だ。その際、写真の中の物体を認識したり、ひとまとまりの文章を翻訳したりするなどのタスクを実行する方法を学習させるために、丁寧にラベル付けされたデータセットを利用する必要はない。

 自己教師あり学習は近年、科学的に大きな注目を集めている。人手でラベル付けするのに必要なデータを大幅に減らせるからだ。これは非常に時間のかかる作業で、ほとんどの研究者はやりたがらない。一方、キュレーションされたデータセットが不要であれば、自己教師ありモデルはより大規模かつ多様なデータセットを処理できる。

 一部の分野、特に自然言語処理の分野では、この手法がすでに飛躍的な進歩につながっている。かつてないほど多くのラベル付けされていないテキストで学習させたアルゴリズムは、質問応答、機械学習、自然言語推論といった用途での発展を可能にした。

 対照的に、コンピュータービジョンでは自己教師あり学習をまだ十分に活用できていない。SEERはその先駆けになるものだと、Facebook AI ResearchのソフトウェアエンジニアであるPriya Goyal氏は米ZDNetに語った。「SEERはインターネット上のランダムな画像でトレーニングされた初の完全な自己教師あり学習のコンピュータービジョンモデルだ。これに対し、コンピュータービジョンにおける既存の自己教師あり学習モデルは、高度にキュレーションされたデータセット『ImageNet』でトレーニングされている」(同氏)

 ImageNetは、膨大な数の画像からなる大規模なデータベースで、研究者らがラベル付けしており、広範なコンピュータービジョンのコミュニティーに開放されて、AIの発展に役立っている。

 Facebookの研究チームは、SEERのパフォーマンスを評価するベンチマークとしてこのプロジェクトのデータベースを利用した。研究チームの調査によると、この自己教師あり学習モデルは、ローショット(サンプル数の少ない)学習、オブジェクト検出、セグメンテーション、画像分類などのタスクで、最新の教師ありAIシステムのパフォーマンスを上回ったという。

  Goyal氏は、「SEERは、無作為の画像で学習させるだけで、既存の自己教師ありモデルのパフォーマンスを上回る」として、次のように述べた。「この結果は基本的に、コンピュータービジョンにImageNetなどの高度にキュレーションされたデータセットは不要であり、無作為の画像による自己教師あり学習から非常に高品質のモデルが生まれることを示している」

この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。

ZDNet Japan 記事を毎朝メールでまとめ読み(登録無料)

特集

CIO

モバイル

セキュリティ

スペシャル

ホワイトペーパー

新着

ランキング

  1. 経営

    Microsoft 365の「データ」は本当に安全?SaaSユーザーのためのデータ保護アプローチ

  2. セキュリティ

    マルチクラウドの本格活用から量子コンピューティングへ、その時鍵を握るデータ保護の仕組みとは?

  3. 運用管理

    最先端のデータサイエンティストでいるための5つのヒント—AIによる高度化でデータの達人であり続ける

  4. ビジネスアプリケーション

    中小企業のためのAI活用--予算も人材も不足していた4社の脱Excelそして入AI実現例

  5. 運用管理

    業務改革の推進者が最初につまずく「現場業務ヒアリング」、通信・製造業、自治体の事例に見る回避策

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNet Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]