伊藤忠テクノソリューションズ(CTC)は、障がい者雇用を推進する特例子会社のCTCひなりと共同で、人工知能(AI)のためのデータ準備(Data Preparation)サービスを提供開始した。
CTCが金融業を中心とした顧客から受注したAIやデータ分析などの案件について、CTCひなりがデータの表記揺れや誤記などを整えるデータ準備作業を実施する。
データの整形や加工、あるいは欠損や誤りの修正といったデータ準備作業は、AI導入の作業全体のうち8割を占めるとされている。また、データは日々追加、更新されるため、データ準備作業は継続して行う必要があるが、エンジニアの確保などの課題も発生している。
データ準備サービスは、エンジニアに代わって専門的に作業を請け負う。AIで良く使用されるプログラミング言語のPythonなどを使用して大量のデータを整形する。
例えば、「お客様と顧客」「取締役と役員」などの用語の名寄せや、全角と半角を含めた表記ルールの適用、重複した用語の削除や異常値の除去といった作業を実施する。
CTCひなりは、障がいのある社員を支援する社員(サポートマネージャー)と、主に知的障がいがある社員がチームを組み、2020年初頭からPythonによるデータ整形に取り組んできた。CTCの金融分野におけるAIやデータ分析のノウハウに基づく約1年間の試行期間を経て、定型的なデータの整形に関してはエンジニアと同等の技術水準に達しているという。