スモールデータから知見を見出す「スパースモデリング」

スパースモデリングと機械学習の化学反応--関係性を機械が自動的に発見 - (page 4)

大関真之

2016-03-10 07:00

もっと複雑な機械学習を目指すのか

 彼は再び機械学習の本を読む。今まではよくわからなかったひとつひとつの用語がわかってきた。再び図1のような図を見ても怖くない。右からデータを入力して、色々複雑な関係性を経て、出力結果を説明しようと、ああいう訳の分からないものになっていたんだろう。

 実はこれが深層学習(ディープラーニング)と呼ばれる近年話題の機械学習の飛び道具である。

 圧倒的な識別精度を誇り、音声処理や画像処理、自動的な識別の技術として多くのデータを利用した新規サービスへの展開が始まっている。それこそ自動運転技術や最近話題となったプロ囲碁棋士に勝った人工知能にも利用されている。これまでの機械学習は、入力部分に何を入れるか、ということを人間が構築してきた。

 もちろん深層学習に置いてもそれは変わらないのだが、驚くところは途中にも赤丸がある。途中の赤丸部分が何を表現しているのか、全く分からない。機械学習を精度よく実行するための遊びの部分とも言える。その部分を用意することで圧倒的な性能を誇る以上、歓迎するべき技術であるが、データを解析する立場に立てば、本当に何が有効な要素だったのか? その問いには明確に答えてくれない。

 スパースモデリングの大事なところは、「モデリング」であり、どんな要素が関わって、今目の前にあるデータを表現することがあり得るか、それを自分の手で構築する。そしてどの要素が一番重要か、本質的に効いているのか、それを機械が自動的に学び取ってくれるように「スパース性」を利用するのだ。

 みなさんも彼のように、会社内にあるデータを利用して、これまでの積み上げた経験と矛盾しない本質部分を取り出してみてはどうだろうか。

大関 真之(おおぜき まさゆき)  京都大学大学院情報学研究科システム科学専攻助教
博士(理学)。専門分野は物理学、特に統計力学と量子力学、そして機械学習。2010年より現職。独自の視点で機械学習のユニークな利用法や量子アニーリング形式を始めとする新規計算技術の研究に従事。分かりやすい講演と語り口に定評があり、科学技術を独特の表現で世に伝える。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    「デジタル・フォレンジック」から始まるセキュリティ災禍論--活用したいIT業界の防災マニュアル

  2. 運用管理

    「無線LANがつながらない」という問い合わせにAIで対応、トラブル解決の切り札とは

  3. 運用管理

    Oracle DatabaseのAzure移行時におけるポイント、移行前に確認しておきたい障害対策

  4. 運用管理

    Google Chrome ブラウザ がセキュリティを強化、ゼロトラスト移行で高まるブラウザの重要性

  5. ビジネスアプリケーション

    技術進化でさらに発展するデータサイエンス/アナリティクス、最新の6大トレンドを解説

ZDNET Japan クイックポール

注目している大規模言語モデル(LLM)を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]