スモールデータから知見を見出す「スパースモデリング」

スパースモデリングの実践--データから本質を抜き出す - (page 4)

大関真之

2016-01-20 07:00

軟判定しきい値関数とは

 ズレだけではなくパラメータの必要性も考慮した計算をしないといけないのであれば、複雑になるのではと思う読者もいるかもしれない。驚くなかれ、さきほどの勾配法にたった一行を追加するだけである。「軟判定しきい値関数」という関数を利用すればよい。

【勾配法+軟判定しきい値関数】

 (パラメータの新しい候補値)=(その古い値)-(指定されたパラメータでの微分値)×(更新幅)

 (パラメータの補正後の値)=軟判定しきい値関数[パラメータの新しい候補値]

 軟判定しきい値関数は、スパース推定を用いたデータ解析で、必ず登場するといっても良い重要な関数である。しきい値を持ち、入力の大きさがそのしきい値を超えないと反応しない。そのしきい値を超えると、しきい値分だけ縮こまった値を出力する。何もしない場合に比べて、値が小さくなっているのが特徴だ。この関数の効果は、図で見ると分かりやすい。入力されたものに対して出力が全く変化しないy=xという関数と比較してみよう。


図5:しきい値が1のときの軟判定しきい値関数(青線)。
比較のためy=x(赤線)もプロットしてある。

図6:軟判定しきい値関数のコード。lambdaがしきい値を示す

 データ点にぐにゃりと針金を曲げて合わせようというときに、「この変形は、本当にデータに合わせるために役立っているのか」と指摘される。その変形を反省して、なかったことにする。つまり“零”となるパラメータが出現する。軟判定しきい値関数は、怖い怖い“監督”だ。データに合わせるために、チーム総出でがんばってしまうところを、待て、待て、お前の活躍はそこじゃない、と采配を振るっている。この監督の采配の程度を調整するのがしきい値であり、そのしきい値の大きさが小さければ、監督は大して声をかけない。一方でしきい値が大きければ、監督の声が随分と大きくて、だいぶ萎縮してしまう。しかしそれでも、データを合わせるために本当に貢献しているエースは生き残る。いわば少数精鋭部隊だけでデータに合わせにいくようになるというわけだ。

 実際にこれまでに挙げてきたバネの例で、多項式回帰のプログラムにこの軟判定しきい値関数を挿入してやると、重要な要素は直線の式だけで、他は不要だという結果が得られる。その際、直線の式を示す傾きなどのパラメータが正しい値よりも縮こまる。しかしバネの実験を表すデータを表現するためには、針金を変形したかのような複雑な形を取る必要はなく、直線だけという結論が得られる。つまりフックの法則を知らずとも、その法則をデータだけから見いだすことができる。これがスパース推定の威力だ。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]