確かに機械学習で扱われるデータの形式は、なんでも良い。その対象は無限大だ。
ただ識別をするためには、データをうまく表した“特徴量”が重要となる。全く意味のない部分を見つめてもデータから法則性を取り出すことは難しいのは想像できるだろう。それを自動的に掴めるのが深層学習の利点である。犬と猫の識別にしたって、どこが効いているのかわからない。しかしそれを深層学習では自動的に判別して識別に利用するのだ。
そうなれば、どんなデータであっても深層学習を利用することでその可能性を広げていくことは可能である。もちろんデータの質によっては、なかなかどうしてうまくいかない例もある。うまくいく例とうまくいかない例を調べることによって深層学習の進化が進んでいくのだから避けては通れない道だ。
こういった専門的な研究に深層学習が利用されているという事実そのものがビジネスには直結しないと思われるかもしれないが、それは大きな間違いである。相転移現象を取り扱う理論的研究を進めてきたのは、機械学習とは無縁の物理学者たちである。その物理学者たちが、機械学習の可能性に気づき始めたのだ。
彼らの利用の仕方は、大量のデータを解析するためのツールとしての利用方法だ。データを見極める「専門家の目」として、機械学習を利用している。この専門家の目は、物理学者が彼らの元々保有しているデータを駆使して、育ち始めているのだ。つまり、分野が異なるとしても、育てるためのデータを持っていれば、自分たちのフィールドで活躍する専門家を養うことができるのだ。そうなると小さい会社であってもアイデア次第でチャンスはある。
世の中では人工知能のブームが巻き起こり、さまざまな業務が効率的に改善されて、自分の仕事すらも奪われるのではないかという声さえ聞こえてくる状況だ。しかしどちらかというと、そう言った細かな部分での業務効率よりも、それぞれの業種に特化して用意されたデータを解析する専門家として利用されることの方が多いと考えられる。
ましてや機械がすることだから、一度システムが構築されれば比較的容易にコピーできる。そのシステムを独自に構築して、販売するようなサービスも考えられる。その繰り返しにより、さまざまなデータを取得することで多くの分野の専門的知識を獲得したシステムが初めて構築されるだろう。
そうした人間の努力と機械の進化を通して、物語にあるような魔法の鏡ができあがるのはそう遠くないだろう。
この手の専門家による論文は、分野によっては議論や科学的貢献のために公開されており、特に「arxiv」と呼ばれるウェブサイトでは多くの専門家の研究が報告されている。深層学習や他の機械学習の手法を利用した例を発見できる。