視覚こそAIの「キラーアプリ」--グーグルのチーフサイエンティストが語る

Stephanie Condon (CNET News) 翻訳校正: 湯本牧子 吉武稔夫 矢倉美登里 (ガリレオ)

2017-05-22 10:16

UPDATE Googleのクラウド部門で人工知能(AI)および機械学習担当のチーフサイエンティストを務めるFei-Fei Li氏は、開発者向けカンファレンス「Google I/O 2017」の最終日に行われたパネルディスカッションで、AIは「第4次産業革命の原動力」だと主張した。同氏はさらに、AIは「人間が生活し、働き、コミュニケーションを取る方法を変える可能性を秘めている」と述べた。

 とはいえ、技術者らはまだAIのインパクトを認識し始めたばかりだ。Li氏によると、AIが成熟する過程では、視覚が「AIのキラーアプリ」になるという。

 Li氏は、先ごろもTechCrunchの取材で、およそ5億4000万年前、カンブリア爆発の原動力となったのは視覚だった可能性が高いと指摘した。カンブリア爆発とは、比較的短い期間で多様性に満ちた生命体が出現した現象のことだ。Li氏は、「最初に動物の目が発達したとき、動物の暮らしは突如として能動的なものになった。(中略)進化の形が変わったのだ」と説明した。それから数億年後、人間は最も知的能力の高い視覚的動物となり、人間の脳はその半分が視覚処理のために使われている。

 一方、現在の世界で視覚データが占める膨大な規模からも、その重要性がわかる。Li氏は、サイバー空間全体の実に80%超がピクセル形式だと推定されていることを指摘した。同氏によると、「Google Cloud Platform」の顧客からは動画処理や動画分析などの能力についてよく尋ねられるという。

 Li氏はコンピュータビジョンについて、「マシンインテリジェンスの特に重要な要素であり、大小の企業を変革するものだ」と強調した。

 この10年間で、物体認識や画像のタグ付けといった基本的な認知作業は大いに前進したが、Li氏は、次なる大きな段階は「視覚+X」だと述べた。つまり、企業の変革は、コンピュータビジョンの機能を他の研究分野と組み合わせることでもたらされるというのだ。

 たとえば、視覚はコミュニケーションにおいて「欠かせない」役割を果たし、動画のインデックス作成のような機能に役立つ言語能力と視覚を結びつける機会が開かれている、とLi氏は指摘する。視覚は、生物科学やロボット工学においても大きなポテンシャルを持つという。

 GoogleはI/Oで、「AIファースト」戦略を引っ張る、コンピュータビジョンにおける自社の前進について紹介した。「Google Assistant」や「Googleフォト」を皮切りに、2017年にさまざまな製品にどういう形でコンピュータビジョン機能を搭載していくかを明らかにしたのだ。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    「デジタル・フォレンジック」から始まるセキュリティ災禍論--活用したいIT業界の防災マニュアル

  2. 運用管理

    「無線LANがつながらない」という問い合わせにAIで対応、トラブル解決の切り札とは

  3. 運用管理

    Oracle DatabaseのAzure移行時におけるポイント、移行前に確認しておきたい障害対策

  4. 運用管理

    Google Chrome ブラウザ がセキュリティを強化、ゼロトラスト移行で高まるブラウザの重要性

  5. ビジネスアプリケーション

    技術進化でさらに発展するデータサイエンス/アナリティクス、最新の6大トレンドを解説

ZDNET Japan クイックポール

注目している大規模言語モデル(LLM)を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]