人間の知見や経験をどう機械学習に取り込むか――そこにかかっている。しかしその取り込むときに、本当に重要な部分はどこだったのかを理解する段階で有用なのは、やはりスパース性を利用することだ。そこで人間は自動的に抽出された本質部分をもとに知識を整理することでさらに叡智の洗練化が進む。こうして機械と人間の協業が進み、機械学習が開く新時代が到来するものと筆者は期待している。
人間の知識や経験を生かすというのは機械学習の決まり文句かもしれない。過去にどういう傾向にあったかを示すデータを学び取るのが機械学習の基本だからだ。データのどの部分に注目するのか、データの特徴がどこに現れているのかを見抜く力が、機械学習の実践には必要不可欠であった。今では深層学習(脳の神経回路の特性を模した数学モデルである「ニューラルネットワーク」に対する機械学習の手法:Deep Learning)の登場と進化により、特徴部分の自動的な抽出が可能となった。
結局どの部分に注目しているのか、その部分に注目するためには「モデリング」が必要である。モデリングというのは、機械と人間の両者が読める数学的な表現(数式や条件)を記述することである。深層学習では、そのモデリングの大半を自動化することにより放棄している。結局どこの部分が際立っているのかは不明瞭となりがちだ。
一方、モデリングを基本として、そこからどの部分が重要であったかを抽出することで理解につなげるスパースモデリングや、人間の直感をそのモデリングに反映させる方法論は、どの部分に注目すればいいのか、効いているのか明確となる。どちらも得手、不得手、特徴がある。使うべき場面を慎重に判断するべきだ。
データと人間の経験の融合知
「ケプラーの法則」という惑星の運動に関する法則がある。これは 16世紀のデンマーク人の天文学者Tycho Brahe氏の膨大な観測データをもとに、弟子のJohannes Kepler氏がデータを解析することで導いたものである。つまり人間がデータを観測して、その解析結果を学び取ってきた時代だ。経験科学の時代である。
一方で現代は、データから学びとるのは機械であり、その結果を見て新しい知識を発見するというわけだ。そこには膨大なデータが投入されて日々発見や知識の吸収が起こる。まさにデータ駆動型の科学の時代だ。その到来の先には、データから学びとるだけでなく、人間の振る舞いや動作、感覚を抽出して、データと人間の経験を融合させる新たな取り組みが世界各地で起こるだろう。
そしてそれは密かに始まっている。ビジネスの世界でも、第3回でたとえ話としてあげた人事部の評価の話題があったが、それぞれの業態で蓄積したデータのみならず、それぞれの活躍する舞台で、経験豊富なベテランの知識を吸収することで、技術や伝統を引き継ぐこともできる。
今も昔も人が時代を作るのだ。その意味で機械学習が開く新時代は、機械が独立して支配するような嫌なものではない。むしろ機械と人間が協働して新しい発見をお互いにして、共鳴する良い時代だ。そうなるように、1人の研究者として科学的活動を今後進めたい。
- 大関 真之(おおぜき まさゆき) 京都大学大学院情報学研究科システム科学専攻助教
- 博士(理学)。専門分野は物理学、特に統計力学と量子力学、そして機械学習。2010年より現職。独自の視点で機械学習のユニークな利用法や量子アニーリング形式を始めとする新規計算技術の研究に従事。分かりやすい講演と語り口に定評があり、科学技術を独特の表現で世に伝える。