多くのAIシステムでは、一般に「教師あり学習」「教師なし学習」「強化学習」という3つの機械学習のアプローチのいずれかを使って、予測アルゴリズムを開発している。教師あり学習とは、ラベル付けを行ったデータセットに基づいて、「結果の予測を人間の専門家にできるだけ近づける」ことを目指すものだ。一方、教師なし学習は、「ラベル付けを行っていないデータの中から、自然に形成されているグループを発見し、人間の目には一見明らかではない構造を明らかにする」ことを目指している。また、もっとも進んだ形態の機械学習である強化学習は、主に「スタート地点と評価関数だけ」で学習するものだという。
しっかりとした検証プラットフォーム:検証プラットフォームは、「新たな予測アルゴリズムや意思決定アルゴリズムが立てた仮説をテストし、提案された変更が意図した効果を挙げているかどうかを確認する」ためのメカニズムだ。この仕組みはAI工場にとって必要不可欠であり、最先端のプラットフォームが必要だとIansiti氏とLakhani氏は述べている。これは、「従来のアドホックなアプローチによる検証では、扱う必要のある影響を扱い切れない」ためだ。
ソフトウェアインフラの刷新:この場合のソフトウェアインフラとは、エンドユーザーに提供されている、一貫性のあるコンポーネントとなるアプリケーションやサービスに、パイプラインを埋め込んだシステムの集合体だ。「集約され、クリーニングされ、改善され、処理されたデータが、APIなどの一貫性のあるインターフェースを通じて提供される。アプリケーションは素早くそれを引き出し、必要とするサンプルを手に入れ、テストし、デプロイすることができる」と同氏らは説明する。「これによって、アジャイル開発チームは、新しいアプリケーションを数週間、場合によっては数日間で構築できるようになる」
著者らは、適切に設計されたAPIは、AI工場の重要な構成要素であると強調し、次のように述べている。「APIは、ソフトウェア工場のシステムに対するデータの入出力の流れを制御する役割を果たす」と同氏ら述べ、「APIは組織内の重要で秘密性の高い資産へのアクセスをコントロールする」と続けた。また最終的には「AI工場のベースとなるデータ、ソフトウェア、接続性は、安全かつ堅牢で、スケーラブルなコンピューティングインフラ上に置く必要がある。これらはクラウドに置かれることが多くなり、オンデマンドで規模を拡大可能で、標準的な既存のコンポーネントとオープンソースソフトウェアを使って作られるようになるだろう」と述べている。
提供:Joe McKendrick
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。