スモールデータから知見を見出す「スパースモデリング」

人間と機械の協業の未来--専門家の知識を機械学習に統合する

大関真之

2016-06-01 07:00

 これまで、少ないデータから意味を見出すための方法論「スパースモデリング」(スパース性)についてさまざまな事例を用いながら解説してきた。今回はスパース性を絡め、データと人間の経験の融合させるという機械学習の取り組みを紹介する。

イカサマを疑うのは誰か

 コインを何度も振っていると、表が出たり、裏が出たりする。結果はその時々で違い、いわゆる「確率的な現象」となる。コインも物体であることには間違いないから、うまく投げたらいつでも表に、いつでも裏にできそうにも感じるが、素人にはうまくできない。コインの表裏の記録もれっきとしたデータである。

 「データに基づいて、その背後にある関係を捕まえることを機械に任せ、機械が勝手にその法則性を学び、次に何が起こるかを予言する」――この一連の所作を機械学習という。

 では、コインを3度投げ、3回立て続けに表が出たとしよう。あなたはそのコインにイカサマがあると断定できるだろうか。

スパース性は人間の直感

 こうして起きた事実を基に、そのコインの性質を学び取れというのが機械学習の第一段階である。その時に「データに忠実に」学習するべきかどうか。コインの表が立て続けに、実は「たまたま」出てしまった場合に、そのデータに基づきコインの性質を決めると、“イカサマ”を疑うはめになる。

 このように少ないデータから機械学習を駆使して、背後にあるコインの性質や物事の真理を学び取ろうとすると、データを信じ過ぎてしまうという「過学習」という問題が生じてしまう。過学習の際、データをあまりに信じ過ぎてはいけないと人間が手で押さえつける方法を「正則化」という。

 なぜ人間は、データをあまり信じ過ぎてはいけないということを知っているのだろうか。それは過去の膨大なデータに裏打ちされた経験があるからだ。実は人間もビッグデータの申し子であり、人間はこれまで大量のデータにさらされて、学習してきた優れたマシンなのだ。その人間を差し置いて「学習」の進化があり得るだろうか。

 考え方は2つに分かれるだろう。「機械を賢くさせるために、人間の力はできる限り排除するべきだ」という考え。「いや人間の知恵を利用して、機械を加速度的に進化させるべきだ」という考え。後者は最終的には機械を自立させることを目指しているが途中は並走するべきだというわけだ。

 以前、紹介した回帰の問題を思い出してほしい。いくつかのデータ点にできる限り近くなるようにグラフの形を決めるという話だ。これもデータこそが真実なのだから、その点に忠実に沿うようにグラフを決めたら良いというのはもっともだ。しかし、そのデータには不確実な要素があり、信用に足らないこともあるし、数が少ないと過学習の恐れはある。

 そして何より、人間の意志である。複雑な現象であってもできる限り単純化できたら良いな、それを美しいと思う、自然だと思う何か感情めいたものがある。何より物事を理解するためには、必要最低限の情報に止めて、雑音は防ぎたい。そのためにスパースな本質をえぐりとる技術が歓迎される。全ては人間の知恵と利益の追求から来ているのだ。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. ビジネスアプリケーション

    生成 AI 「Gemini」活用メリット、職種別・役職別のプロンプトも一挙に紹介

  2. セキュリティ

    まずは“交渉術”を磨くこと!情報セキュリティ担当者の使命を果たすための必須事項とは

  3. セキュリティ

    迫るISMS新規格への移行期限--ISO/IEC27001改訂の意味と求められる対応策とは

  4. セキュリティ

    マンガで分かる「クラウド型WAF」の特徴と仕組み、有効活用するポイントも解説

  5. ビジネスアプリケーション

    急速に進むIT運用におけるAI・生成AIの活用--実態調査から見るユーザー企業の課題と将来展望

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]