AI insideは6月4日、独自開発する日本語ドキュメント処理に特化した大規模言語モデル(LLM)の最新版「PolySphere-3」を発表した。帳票データの読み取りで高水準の精度を達成しているという。
PolySphere-3は、経済産業省と新エネルギー・産業技術総合開発機構の「GENIAC」プロジェクトで採択された「生成AI基盤による非定型帳票の革新と自律促進」での成果に基づいて開発されたもの。同社はGENIACの第2サイクルで、PolySphere-3と軽量版モデルの「PolySphere-3 Lite」を構築している。
同社の独自評価によれば、50種類の帳票に対して読み取り精度でPolySphere-3は平均95.1%を達成したといい、汎用(はんよう)的なLLMに比べて高い精度を達成。モデル自ら帳票を学習、最適化し、継続的に精度を向上する「自律蒸留」の仕組みを取り入れている。
同社は、データ入力業務自動化AIエージェントの「DX Suite」で、項目抽出機能にPolySphere-3を実装。ユーザーは追加の手続きや費用なしで非定型帳票の読取精度を向上できるとし、DX Suiteが処理する上位9割の帳票での読み取り精度が95%を超えているという。
ユーザー向けには、PolySphere-3が標準で適用されるが、処理速度を重視する場合はPolySphere-3 Liteに変更できる。