Uncovering the Temporal Dynamics of Diffusion Networks
-
Manuel Gomez-Rodriguez, David Balduzzi, Bernhard Schölkopf
-
ICML 2011
概要
-
遅延を含めた情報拡散モデル
-
カスケードだけから,辺とその情報を学習
-
関連
モチベーション
-
whereとwhenはわかるがhowとwhyは分からない
-
いつ誰が記事を投稿 / 病気に感染したかはわかるけど,その経路とか根は分からない
-
仮定
-
拡散は(その構造は分からない)静的グラフ上で起こる
-
状態は活性 or 非活性
-
辺毎の感染は独立
-
a->bでの拡散の遅延は何かしたの確率分布に従う
-
ある時間窓での感染がすべてわかる
-
目的
モデル
データ
-
沢山カスケードがある
-
各カスケードは各頂点が活性化した時刻を持っている
-
活性化しなかったら∞
-
観測は[0,T]の時間窓に制限
尤度
-
f(t_i | t_j, α_{j,i})
-
jからiへの拡散の条件付き尤度
-
例えば今t_jでjが活性化して,t_iでiが活性化する確率はf = α_{j,i}exp(-α_{j,i}(t_i-t_j))とか
-
他にもべき則とかRayleighとか作った
-
適当にfの関数を決めた後,全カスケードにの尤度を最大化するような各α_{j,i}をもとめるのが問題
-
目的関数はαに対して凸になるので,凸計画をソルバで解けばOK
-
実際には少し最適化をしている
-
イマイチ辺が自乗になってやばそうだけど,
-
提案手法のところを見ると時間で区切っているから大丈夫なのかな…?
実験
-
上に書いた既存研究との比較
-
10K頂点以上でも動くっぽい?
ICML 情報拡散 情報拡散パラメータ推定 情報拡散モデル
2014-05-21 22:38:16 (Wed)
最終更新:2014年05月21日 22:38