Influence and Correlation in Social Networks
-
Aris Anagnostopoulos, Ravi Kumar, Mohammad Mahdian
-
KDD 2008
概要
-
社会的な繋がりは大事ですよ
-
相関(似た行動)を引き起こすのは、「社会影響」の所為?
-
単純なテストを考案
-
Flickrで調べたら、相関はあるけど影響の所為ではない
導入とか
-
既存研究「Flickrで友達同士のタグの語彙が似ている」
-
相関の源は?
-
influence
-
homophily
-
environment (confounding factors / external influence)
-
友達は同じ場所に住んでいやすい、同じ写真を投稿する
-
実際のデータにはオンラインの行動時刻があるので、利用しよう!
モデル
-
確率的モデル
-
時間の因子を入れたモデル3つを考える
-
Homophily
-
Environment (Confounding factor)
-
Influence
手法
相関の測定
-
a人の友達が既に活性
-
$$ p(a) \frac{\exp(\alpha \ln (a+1)+\beta)}{1+\exp(\alpha \ln(a+1)+\beta)} $$
-
αが社会相関を測る
-
αとβの最尤推定をする、適当にやれば出来る
Shuffle test
-
影響が無意味なら、活性化のタイミングが互いに独立
-
活性化時刻をシャッフルしても推定したαが似ていれば、社会影響の所為では無い!
-
理論的解析もあるよ
-
例で説明…影響モデルならαがかなり異なる
Edge-reversal test
-
辺の向きをひっくり返す
-
αはどんなもんでしょうか?
実験
シミュレーション
-
生成モデル
-
no-correlation:本当にランダム
-
influence:
-
correlation (no-influence):何かそれっぽい感じにとる
-
αのヒストグラムとCDFを出してみる、Shuffle testが上手く作動している
実データ
-
タグづけ行動のログを見てみる
-
色んな成長パターンがある:bursty ("halloween"), smooth ("photos"), periodic ("moon")
-
結論:相関はあるが、源≠影響
まとめ
KDD 情報拡散 社会影響
2017/06/26
最終更新:2017年06月26日 12:58