東芝情報システム、AIの学習に必要な教師データを短期間で大量作成するサービスを提供

NO BUDGET

2023-01-19 07:30

 東芝情報システムは、人工知能(AI)の学習に必要な教師データを自動作成する「自動アノテーションサービス」の提供を開始した。同サービスは、ユーザーの教師仕様に基づいた教師例と教師対象データを預かり、高精度な教師データを自動作成し、短期間で提供する。なお手作業による教師データ作成の中でも特に時間を要する、画像のセマンティックセグメンテーションを対象としている。

「自動アノテーションサービス」の提供イメージ
「自動アノテーションサービス」の提供イメージ

 同サービスでは、東芝情報システムが独自に開発した自動アノテーションプラットフォームを活用することににより、画像のセグメンテーション手法を複数組み合わせ、高精度な教師データを作成することができる。このプラットフォームは自動アノテーションに必要となる事前学習を行っており、ユーザーから預かった少量の教師例を追加学習させることで、ユーザーの仕様に合わせた高精度な教師データを自動作成する。

 また18クラスを認識する自動運転向け教師データ作成のベンチマークでは、自動アノテーションプラットフォームに、ユーザーから預かる教師例とみなした5000枚を追加学習させ、教師データを自動作成したところ、精度(mIoU) 84.7% という高精度を実現した。

 認識対象の18クラスは、乗用車、トラック、バイクや自転車、車道、歩行者、空、車線、歩道、縁石、ガードレール、道路標識、植生、電柱、建物、障害物、駐車場、自車、その他(認識対象では無い物)。ベンチマークでは、遠方の車種、重なり合った物体、植生の複雑な境界などを、高い精度で認識、識別できた。

自動運転を想定した車載向けベンチマークによる、セマンティックセグメンテーション例
自動運転を想定した車載向けベンチマークによる、セマンティックセグメンテーション例

 さらなる精度の改善にも「自動アノテーションサービス」で作成する教師データを活用することで、手作業の修正量を大きく削減することができる。

 また今回行ったベンチマークでは、1日(24時間)で9600枚の教師データが作成可能だった。これを手作業で作成した場合は、1日(8時間)で16枚の教師データしか作成できないことから、99%以上の作成時間削減を実現したことになるという。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

注目している大規模言語モデル(LLM)を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]