予測的アナリティクスと機械学習は、それぞれ単独の技術として、あるいは組み合わせて使われることで、組織の成功に役立つかもしれない。しかし、これらが実際にどう役立つかを知るためには、その仕組みを理解しておくことが重要だ。
では、予測的アナリティクスとは一体何だろうか?DatafloqのMark van Rijmenam氏は、たとえ話に自動車を使っている。同氏は、従来の記述的アナリティクスは、過去に何が起こったかを知ることのできるバックミラーのようなものであり、予測的アナリティクスはこれから何が起こるかを見せるカーナビに、指示的アナリティクスは運転手を目的地に運ぶ方法を知っている自動運転車に似ていると説明している。
このたとえ話は分かりやすいが、説明が簡単すぎて必ずしも実相を表しているとは言えない。しかし解釈することは自由であり、まずはこれを議論のスタート地点にしてみよう。カーナビは、可能性のある経路を導き出すために関係する、あらゆるデータにアクセスできるように作ることもできるだろう。その場合、データに基づいて経路を示すことは、果たして真に「予測」と言えるだろうか。その作業はアルゴリズムによる決定論的なものであり、真に「知能」とは言えないのだろうか。あるいは、これは定義や意味の問題なのだろうか?
その答えは、カーナビの定義や仕組みによる。通常カーナビは、ドライバーの行き先を予想することはしない。カーナビが行うのは、具体的な指示を待って、A地点(それが明示的に指示されたスタート地点であれ、GPSの情報を用いて取得した現在位置であれ)から、B地点までたどり着く方法を導き出すことだ。
ここで別の例として、搭乗ゲートリーダーを考えてみよう。搭乗ゲートリーダーは、特定の時間に、特定の人物に対して、空港の特定エリアへの立ち入り許可を与えてよいかを判別可能なシステムだ。技術に詳しくない人にとっては、搭乗ゲートリーダーの仕組みはナビと同じように不可思議なもので、このシステムがどのような仕組みになっており、正しい動作がどのようなものかを理解するのは難しいだろう。
技術に詳しい人にとっては、どちらの例についても取り立てて言うことはない。どちらの場合も、必要なすべての情報(カーナビの場合は道路や距離、搭乗ゲートリーダーの場合は乗客リスト)を持つデータベースがあり、与えられた入力に対して出力を決定するアルゴリズムが存在し(AからBまでの最速経路の求め方、乗客XがフライトYのリスト中に存在するか)、システムと外部をつなぐメディアを持っている(GPS、バーコードリーダー)。実際、どちらのシステムでも本当の「予測」が行われているわけではない。
その観点から見ると、これらのシステムは実装の細部やアルゴリズムやデータの複雑さの面でこそ違いがあるかもしれないが、本質的にはそれほど異なるものではない。それでも、IT業界に搭乗ゲートリーダーを予測システムに分類する人はあまりいないかもしれないが、カーナビを予測システムと呼ぶ人はいるかもしれない。その違いは、搭乗ゲートリーダーの答えが真か偽か(立ち入りを許可するか、許可しないか)であるのに対して、カーナビは具体的な指示に答えることにあるのだろうか。