続いて、「IAAI-17: Sense-Making: Using Automated Systems to Pull Out Patterns and Structure from Data」という講演トラックに参加しました。
その理由は「Automated Data Cleansing through Meta-Learning(メタラーニングを通した自動データクレンジング)」 という、(データの前処理の解決に悩まされる)データサイエンティストにとっては夢の技術に聞こえる講演があり、これを聴講するためです。元になってる論文はコチラの模様。
この講演はメタラーニングを活用し、欠損補完や標準化、特徴量削減、不均衡調整などのいわゆる前処理を自動化してしまおうという野心的な企みです。
やはりここが急所というか、興味あるところのようで多数の方が聴講しに来ていました。この研究の結論としては、メタ特徴量(データの多様体上へのマッピング)がうまく構成されておらず、ここをより良いものに変えることが必要であると結んでいて、非常に挑戦的でした。
4日目は学会自体が最終日であり、テクニカル・トラックの数も少なく、再び「ML25: Recommender Systems(推薦システム)」に参加しました。
ここでは、通常、レコメンドなどでしばしば行われる行列分解(Matrix Factorization:MF)を計算する方法を改良するという研究が報告されていました。最近流行りの分散処理フレームワークであるApache Sparkでも使用されているAlternating Least Squares(ALS)というアルゴリズムがあります。
これはある行列を分解した結果となる2つの行列を、交互に固定して最適化計算していく手法なのですが、なぜ一度に両方の行列を扱わず 交互に計算するのかというと、全体を同時に考えると非凸な最適化問題になるからです。
一方、このやり方は、計算された答えが局所最適解になっている可能性を否定しないので、ここをうまく改良したという研究です。
具体的には全領域で正になるような多項式を考え、目的関数を二乗和の多項式の最適化として記述することで計算可能にするそうです。講演の元になっている論文は(おそらく)コチラ(PDF)。
以上で私が参加したAAAI参加方向は終了です。機械学習手法の研究から、ヘルスケア(IoT)、自動運転、ロボットなど数多くのトピックについての講演があり、各種トピックの最先端について勉強するための非常によい機会となりました。皆さんの機械学習・人工知能開発ライフの一助になれば幸いです。
- 高柳慎一(たかやなぎ しんいち)
- 株式会社リクルートコミュニケーショズ
- 材料科学系財団、金融系シンクタンクを経て現職。 専門分野は統計科学、リクルートが保有するビッグデータを活用するための機械学習・人工知能の開発を担当。 訳著書『金融データ解析の基礎』共立出版 (2014)、『みんなのR』マイナビ(2015)など多数。
ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)
特集
- デジタルジャーニーの歩き方
- トップインタビュー
- DMARC導入待ったなし!
- パスキー徹底解説:パスワードレスな未来への完全ガイド
- PDF Report at ZDNET Japan
- 持続可能な地域社会を目指す「地域DX」
- さまざまなLinuxディストリビューションの世界
- ビジネスアジリティー向上:ビジネスのスピードアップを図ろう
- 松岡功の「今週の明言」
- 「GIGAスクール構想」で進化する教育現場
- 松岡功の一言もの申す
- Linuxノウハウ
- 流通テック最前線
- カーボンニュートラル(脱炭素)
- デジタル岡目八目
- ICT来し方行く末
- トランスフォーメーションの破壊者:インテントAI
- 中国ビジネス四方山話
- Ziddyちゃんの「私を社食に連れてって」
- 「ひとり情シス」の本当のところ
- DXで直面するカベを突破せよ
- D&Iで切り開く、企業の可能性
- ビジネス視点で分かるサイバーのリスクとセキュリティ
- 技術者視点で見るメインフレームの進化と深化
- 世界のICTが集まるアイルランド
- 「働く」を変える、HRテックの今
- CIO・情シス部長が知っておきたい「データクラウド」の基本と構造
- 企業セキュリティの歩き方
- 対応必須化の波が到来したSBOM動向
- サプライチェーン管理高度化のススメ