スモールデータから知見を見出す「スパースモデリング」

人間と機械の協業の未来--専門家の知識を機械学習に統合する

大関真之 2016年06月01日 07時00分

  • このエントリーをはてなブックマークに追加

 これまで、少ないデータから意味を見出すための方法論「スパースモデリング」(スパース性)についてさまざまな事例を用いながら解説してきた。今回はスパース性を絡め、データと人間の経験の融合させるという機械学習の取り組みを紹介する。

イカサマを疑うのは誰か

 コインを何度も振っていると、表が出たり、裏が出たりする。結果はその時々で違い、いわゆる「確率的な現象」となる。コインも物体であることには間違いないから、うまく投げたらいつでも表に、いつでも裏にできそうにも感じるが、素人にはうまくできない。コインの表裏の記録もれっきとしたデータである。

 「データに基づいて、その背後にある関係を捕まえることを機械に任せ、機械が勝手にその法則性を学び、次に何が起こるかを予言する」――この一連の所作を機械学習という。

 では、コインを3度投げ、3回立て続けに表が出たとしよう。あなたはそのコインにイカサマがあると断定できるだろうか。

スパース性は人間の直感

 こうして起きた事実を基に、そのコインの性質を学び取れというのが機械学習の第一段階である。その時に「データに忠実に」学習するべきかどうか。コインの表が立て続けに、実は「たまたま」出てしまった場合に、そのデータに基づきコインの性質を決めると、“イカサマ”を疑うはめになる。

 このように少ないデータから機械学習を駆使して、背後にあるコインの性質や物事の真理を学び取ろうとすると、データを信じ過ぎてしまうという「過学習」という問題が生じてしまう。過学習の際、データをあまりに信じ過ぎてはいけないと人間が手で押さえつける方法を「正則化」という。

 なぜ人間は、データをあまり信じ過ぎてはいけないということを知っているのだろうか。それは過去の膨大なデータに裏打ちされた経験があるからだ。実は人間もビッグデータの申し子であり、人間はこれまで大量のデータにさらされて、学習してきた優れたマシンなのだ。その人間を差し置いて「学習」の進化があり得るだろうか。

 考え方は2つに分かれるだろう。「機械を賢くさせるために、人間の力はできる限り排除するべきだ」という考え。「いや人間の知恵を利用して、機械を加速度的に進化させるべきだ」という考え。後者は最終的には機械を自立させることを目指しているが途中は並走するべきだというわけだ。

 以前、紹介した回帰の問題を思い出してほしい。いくつかのデータ点にできる限り近くなるようにグラフの形を決めるという話だ。これもデータこそが真実なのだから、その点に忠実に沿うようにグラフを決めたら良いというのはもっともだ。しかし、そのデータには不確実な要素があり、信用に足らないこともあるし、数が少ないと過学習の恐れはある。

 そして何より、人間の意志である。複雑な現象であってもできる限り単純化できたら良いな、それを美しいと思う、自然だと思う何か感情めいたものがある。何より物事を理解するためには、必要最低限の情報に止めて、雑音は防ぎたい。そのためにスパースな本質をえぐりとる技術が歓迎される。全ては人間の知恵と利益の追求から来ているのだ。

  • このエントリーをはてなブックマークに追加

関連ホワイトペーパー

SpecialPR

連載

CIO
研究現場から見たAI
ITは「ひみつ道具」の夢を見る
内製化とユーザー体験の関係
米ZDNet編集長Larryの独り言
今週の明言
「プロジェクトマネジメント」の解き方
田中克己「2020年のIT企業」
松岡功「一言もの申す」
林 雅之「デジタル未来からの手紙」
谷川耕一「エンプラITならこれは知っとけ」
Fintechの正体
内山悟志「IT部門はどこに向かうのか」
情報通信技術の新しい使い方
三国大洋のスクラップブック
大河原克行のエンプラ徒然
コミュニケーション
情報系システム最適化
モバイル
通信のゆくえを追う
セキュリティ
セキュリティの論点
ネットワークセキュリティ
スペシャル
座談会@ZDNet
Dr.津田のクラウドトップガン対談
CSIRT座談会--バンダイナムコや大成建設、DeNAに聞く
創造的破壊を--次世代SIer座談会
企業決算を追う
「SD-WAN」の現在
展望2017
IBM World of Watson
de:code
Sapphire Now
VMworld
Microsoft WPC
HPE Discover
Oracle OpenWorld
Dell EMC World
AWS re:Invent
PTC LiveWorx
古賀政純「Dockerがもたらすビジネス変革」
さとうなおきの「週刊Azureなう」
誰もが開発者になる時代 ~業務システム開発の現場を行く~
中国ビジネス四方山話
より賢く活用するためのOSS最新動向
「Windows 10」法人導入の手引き
Windows Server 2003サポート終了へ秒読み
米株式動向
実践ビッグデータ
日本株展望
ベトナムでビジネス
アジアのIT
10の事情
エンタープライズトレンド
クラウドと仮想化