世界最高峰の人工知能学会「AAAI」では何が語られているのか(後編) - (page 3)

高柳慎一

2017-03-15 07:00

 続いて、「IAAI-17: Sense-Making: Using Automated Systems to Pull Out Patterns and Structure from Data」という講演トラックに参加しました。

 その理由は「Automated Data Cleansing through Meta-Learning(メタラーニングを通した自動データクレンジング)」 という、(データの前処理の解決に悩まされる)データサイエンティストにとっては夢の技術に聞こえる講演があり、これを聴講するためです。元になってる論文はコチラの模様。

 この講演はメタラーニングを活用し、欠損補完や標準化、特徴量削減、不均衡調整などのいわゆる前処理を自動化してしまおうという野心的な企みです。

 やはりここが急所というか、興味あるところのようで多数の方が聴講しに来ていました。この研究の結論としては、メタ特徴量(データの多様体上へのマッピング)がうまく構成されておらず、ここをより良いものに変えることが必要であると結んでいて、非常に挑戦的でした。

 4日目は学会自体が最終日であり、テクニカル・トラックの数も少なく、再び「ML25: Recommender Systems(推薦システム)」に参加しました。

 ここでは、通常、レコメンドなどでしばしば行われる行列分解(Matrix Factorization:MF)を計算する方法を改良するという研究が報告されていました。最近流行りの分散処理フレームワークであるApache Sparkでも使用されているAlternating Least Squares(ALS)というアルゴリズムがあります。

 これはある行列を分解した結果となる2つの行列を、交互に固定して最適化計算していく手法なのですが、なぜ一度に両方の行列を扱わず 交互に計算するのかというと、全体を同時に考えると非凸な最適化問題になるからです。

 一方、このやり方は、計算された答えが局所最適解になっている可能性を否定しないので、ここをうまく改良したという研究です。

 具体的には全領域で正になるような多項式を考え、目的関数を二乗和の多項式の最適化として記述することで計算可能にするそうです。講演の元になっている論文は(おそらく)コチラ(PDF)。

 以上で私が参加したAAAI参加方向は終了です。機械学習手法の研究から、ヘルスケア(IoT)、自動運転、ロボットなど数多くのトピックについての講演があり、各種トピックの最先端について勉強するための非常によい機会となりました。皆さんの機械学習・人工知能開発ライフの一助になれば幸いです。

高柳慎一(たかやなぎ しんいち)
株式会社リクルートコミュニケーショズ
材料科学系財団、金融系シンクタンクを経て現職。
専門分野は統計科学、リクルートが保有するビッグデータを活用するための機械学習・人工知能の開発を担当。
訳著書『金融データ解析の基礎』共立出版 (2014)、『みんなのR』マイナビ(2015)など多数。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

注目している大規模言語モデル(LLM)を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]