dotDataは8月30日、ノーコードのMLOps基盤「dotData Ops」を発表した。機械学習(ML)のパイプラインを一元管理することで、企業のAI/MLの民主化を支援する。
dotData Opsは、データ加工から特徴量生成、MLモデルによる予測までのパイプライン管理を一元化する。最高経営責任者(CEO)で創業者の藤巻遼平氏は同製品について「既存のMLOpsソリューションと分析チームの実際のニーズとのギャップを埋めるために設計された」と説明する。
MLや予測分析プロジェクトでは、概念実証(PoC)からモデルを実際の業務で活用するまでのハードルの高さが大きな課題となっている。PoCでモデルを開発することは単なる始まりに過ぎず、それを業務に適用するためには、システム統合、データ移行、ビジネスワークフローの変更など、MLモデルの実装にとどまらない多大な労力が必要となる。
dotData Opsは、モデルを実業務で試行するために、最も時間とコストがかかるデータ加工と特徴量生成のパイプラインのデプロイを自動化する。データ加工、特徴量生成、そして予測スコアの計算までの一連の処理を、IT部門などの支援なしに、わずか数クリックの操作で展開できる。
データ分析チームが最小限の実行可能なパイプラインを迅速に展開し、「机上のPoC」の限界を越えて、実環境でビジネス価値を迅速に検証できるようにする、セルフサービス型のプラットフォームを提供する。これにより、実業務における素早い価値検証が、意思決定者からの信頼と、本番運用への投資判断を加速するとしている。
同社によると、従来のMLOps基盤は、運用するモデルの健全性をモニタリングすることに重点を置いていた。一方で、モデルと特徴量が実際のビジネスに与える効果を理解するには、技術的な指標だけでなく、ビジネスに関する指標を監視する必要があった。
dotData Opsは、ビジネスインテリジェンス(BI)・分析チームがモデルのパフォーマンスや特徴量に関する指標を、ビジネスの従業業績指標(KPI)と関連付けて追跡する。これによって、ビジネスの結果に影響を及ぼす可能性のあるモデルと特徴量の問題の自動検出が可能になる。単一のプラットフォーム上で、モデル/特徴量の品質とビジネス指標を同時に監視し、データやモデルの変化がビジネスに与える影響を包括的に理解することができる。
データの変化にモデルが対応しきれずに予測精度が劣化してしまうことを「データドリフト」という。従来のMLOps基盤は、MLモデルの精度と特徴量分布の変化(特徴量ドリフト)を監視する。一方、dotData Opsは、特徴量の元となるソースデータまでさかのぼって精度と特徴量の劣化の根本原因を診断することができる。
これは、予測モデルだけでなくソースデータから特徴量を生成するパイプライン全体を運用・管理するというdotData Opsの特徴によって実現される機能で、分析チームはデータエラーやソースデータの変化によって発生するドリフトを検出し、データの修正やモデル・特徴量の更新といった対応を迅速に講じることができるとする。
dotDataはまた、従来のMLOpsでは、予測精度の劣化や特徴量ドリフトに対してモデルの再学習を実施するが、データに大きな変化が発生する状況には対処が不十分だったと指摘。dotData Opsは、データドリフトが発生した際に、特徴量自動設計の技術によって、データの変化に適合した新しい特徴量を再設計することで、この問題を解決する。
これによって、分析チームはデータの変化と発展に伴って出現する新しいデータパターンを発見することが可能となる。単なるモデルの再学習による調整にとどまらず、重要な洞察を継続的に発見し、ビジネスインパクトを最大限に引き出せるという。