A Gang of Bandits

A Gang of Bandits

  • 挑戦する問題
    • bandit problem
    • contextual bandit problem
    • Gang of Bandits
  • Bandit problemとは
  • スロットマシンがいっぱい、どうベットするのがいい?
  • やっていくと確率が推定できる
  • Contextual
  • 報酬を予測しながら行動、結果から予測モデルを修正
  • アイテムの推薦みたいな?
  • 学習
  • 一番良かったの+信頼性みたいなのを考える
  • contextual bandit problemをsocial networksで表現したい!!!!
    • ユーザの興味関心
    • アイテム推薦
    • 隣接するユーザは類似
  • LinUCBっていうcontextual bandit proble用の手法をネットワークに拡張
  • Gang of Bandits.Lin←提案手法!!!!!!!!
  • グラフラプラシアンとか入ってる
    • 更新が近傍に反映されるらしい
  • 実験
  • 比較対象
    • 各々独立更新、と、全部同じパラメータ
  • 問題設定が難しいゾ~

NIPS

2014-01-24 14:17:50 (Fri)

タグ:

NIPS
最終更新:2014年01月24日 14:17