Facebook、画期的なAIモデル「SEER」を発表--10億枚のInstagram画像で学習

Daphne Leprince-Ringuet (ZDNET.com) 湯本牧子 吉武稔夫 (ガリレオ)

2021-03-05 11:14

 Facebookの研究チームは、インターネット上にあるラベル付けされていないランダムな画像グループから学習できる、新たな人工知能(AI)モデルを発表した。この画期的な成果は、まだ初期の段階とはいえ、コンピュータービジョンに「革命」をもたらすことになるとチームは期待している。

多様な画像
提供:Facebook AI

 「SEER(SElf-supERvised:自己教師あり)」と名付けられたこのモデルには、一般に公開されているInstagramの画像10億枚が与えられた。これらの画像は、それまで人手でキュレーション(整理)されたことがないものだ。しかし、一般にアルゴリズムの学習に使われるラベルや注釈がなくても、SEERは自律的にデータセットの内容を調べ、その過程で学習し、最終的にオブジェクト検出などのタスクでトップレベルの正確性を実現した。

 自己教師あり学習という相応しい名前が付けられたこの手法は、AIの分野ではすでに確立されており、その実体は与えられた情報から直接学習できるシステムの開発だ。その際、写真の中の物体を認識したり、ひとまとまりの文章を翻訳したりするなどのタスクを実行する方法を学習させるために、丁寧にラベル付けされたデータセットを利用する必要はない。

 自己教師あり学習は近年、科学的に大きな注目を集めている。人手でラベル付けするのに必要なデータを大幅に減らせるからだ。これは非常に時間のかかる作業で、ほとんどの研究者はやりたがらない。一方、キュレーションされたデータセットが不要であれば、自己教師ありモデルはより大規模かつ多様なデータセットを処理できる。

 一部の分野、特に自然言語処理の分野では、この手法がすでに飛躍的な進歩につながっている。かつてないほど多くのラベル付けされていないテキストで学習させたアルゴリズムは、質問応答、機械学習、自然言語推論といった用途での発展を可能にした。

 対照的に、コンピュータービジョンでは自己教師あり学習をまだ十分に活用できていない。SEERはその先駆けになるものだと、Facebook AI ResearchのソフトウェアエンジニアであるPriya Goyal氏は米ZDNetに語った。「SEERはインターネット上のランダムな画像でトレーニングされた初の完全な自己教師あり学習のコンピュータービジョンモデルだ。これに対し、コンピュータービジョンにおける既存の自己教師あり学習モデルは、高度にキュレーションされたデータセット『ImageNet』でトレーニングされている」(同氏)

 ImageNetは、膨大な数の画像からなる大規模なデータベースで、研究者らがラベル付けしており、広範なコンピュータービジョンのコミュニティーに開放されて、AIの発展に役立っている。

 Facebookの研究チームは、SEERのパフォーマンスを評価するベンチマークとしてこのプロジェクトのデータベースを利用した。研究チームの調査によると、この自己教師あり学習モデルは、ローショット(サンプル数の少ない)学習、オブジェクト検出、セグメンテーション、画像分類などのタスクで、最新の教師ありAIシステムのパフォーマンスを上回ったという。

  Goyal氏は、「SEERは、無作為の画像で学習させるだけで、既存の自己教師ありモデルのパフォーマンスを上回る」として、次のように述べた。「この結果は基本的に、コンピュータービジョンにImageNetなどの高度にキュレーションされたデータセットは不要であり、無作為の画像による自己教師あり学習から非常に高品質のモデルが生まれることを示している」

この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    警察把握分だけで年間4000件発生、IPA10大脅威の常連「標的型攻撃」を正しく知る用語集

  2. セキュリティ

    まずは“交渉術”を磨くこと!情報セキュリティ担当者の使命を果たすための必須事項とは

  3. セキュリティ

    「2024年版脅威ハンティングレポート」より—アジアでサイバー攻撃の標的になりやすい業界とは?

  4. セキュリティ

    生成AIを利用した標的型攻撃とはどのようなものなのか?実態を明らかにして効果的な対策を考える

  5. ビジネスアプリケーション

    Microsoft 365で全てを完結しない選択、サイボウズが提示するGaroonとの連携による効果

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]