スモールデータから知見を見出す「スパースモデリング」

スカスカのデータから知見を見出す救世主?--「スパースモデリング」とは何か - (page 4)

大関真之

2015-12-01 07:00

スパースモデリングが築くデータ駆動型社会

 このスパースモデリングは単なるデータの解析手法ではない。カンニングの例では、答案のデータから本当に疑わしい学生間のカンニングを抽出してくれる。つまりデータをうまく説明するための必要最低限の本質的な部分を自動的に抽出してくれるのだ。まさにビッグデータ時代に必要な方法論ではないだろうか。この方法論を生かして、次に述べるような計測技術革命が今まさに起こっている。

 身体の具合を調べるために、最近では脳や体内の様子を調べることが可能だ。 CTやMRIなどの医用画像技術において、スパースモデリングが革命を起こしている。体内の情報を、放射線や電磁場により探り、得られたデータを分析することで体内の様子を画像化している。

 そのデータ取得を少し「サボる」。サボった分、ちゃんと身体の様子が見えなくなり、実際図4の左に示すように取得する情報量を削るときれいな画像を描くことができなくなる。


図4:スパース性を利用した脳血管画像の例 
 圧縮センシングは80%データが欠損していても血管画像が再構成できる
京都大学大学院医学研究科 放射線医学講座(画像診断学・核医学) 提供

 しかしながら、取得している情報に実は多くの無駄があったとしたらどうだろう。無駄を省くことで情報の質を下げずに計測できる。画像を保存する際に例えば(RAWデータから)JPEG形式で圧縮をかけて保存をするだろう。しかし見た目には何ら変化がない。それは多くの情報が無駄であり、無駄を省くことでデータのサイズを小さくできるのだ。ならば本質的に必要なデータの量は実は少ないのではないだろうか。

 医用画像技術においては、この画像情報の無駄データをあらかじめ省くという方向性の研究が進展して、必要最低限の情報を取得することで診断に十分な品質の画像を取得することが可能になった(図4右)。

 この医用画像に関しての応用は、2007年のMichael Lustig氏(UC Barkley准教授)らのグループによる研究を契機として急速に広がった。日本も負けておらず2002年頃の工藤博幸氏(筑波大学教授)らのグループによる先駆的研究がある。

 まさに計測革命である。MRI撮像の時間短縮により、密閉された空間内でおとなしくすることが難しい幼児の医用診断画像の取得が可能となった。さらには無駄を省いた分の余裕を利用することで、時間軸方向にもデータ取得を拡張することで、MRI画像による「動画」の取得も可能となった。その背後にある技術を「圧縮センシング」と呼び、スパースモデリングの枠組みの中の一角を占めている。

 医用画像だけではなく、さまざまな計測技術と組み合わせることで、次々に計測革命が起こり、「見える世界」が一変している。

 これらの通り、連載第1回では少ないデータから重要な知見を自動的に引き出すスパースモデリングの概要、そして可能性について解説した。次回はスパースモデリングを実際に使う方法を簡単なプログラムを交えながら紹介する予定である。

大関 真之(おおぜき まさゆき)  京都大学大学院情報学研究科システム科学専攻助教
博士(理学)。専門分野は物理学、特に統計力学と量子力学、そして機械学習。2010年より現職。独自の視点で機械学習のユニークな利用法や量子アニーリング形式を始めとする新規計算技術の研究に従事。分かりやすい講演と語り口に定評があり、科学技術を独特の表現で世に伝える。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

マイナンバーカードの利用状況を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]