Influence and Correlation in Social Networks

Influence and Correlation in Social Networks

  • Aris Anagnostopoulos, Ravi Kumar, Mohammad Mahdian
  • KDD 2008

概要

  • 社会的な繋がりは大事ですよ
  • 相関(似た行動)を引き起こすのは、「社会影響」の所為?
    • 同類性とか他の色々な要素があって紛らわしい
  • 単純なテストを考案
  • Flickrで調べたら、相関はあるけど影響の所為ではない

導入とか

  • 既存研究「Flickrで友達同士のタグの語彙が似ている」
  • 相関の源は?
    1. influence
      • 友達の最近の行動に引き起こされる
    2. homophily
      • 同じゲームを持っている人は友達になりやすい
    3. environment (confounding factors / external influence)
      • 友達は同じ場所に住んでいやすい、同じ写真を投稿する
  • 実際のデータにはオンラインの行動時刻があるので、利用しよう!

モデル

  • 確率的モデル
    • 予測できる、最適化、フィッティング
  • 時間の因子を入れたモデル3つを考える
  • Homophily
  • Environment (Confounding factor)
  • Influence

手法

相関の測定

  • a人の友達が既に活性
  • $$ p(a) \frac{\exp(\alpha \ln (a+1)+\beta)}{1+\exp(\alpha \ln(a+1)+\beta)} $$
  • αが社会相関を測る
  • αとβの最尤推定をする、適当にやれば出来る

Shuffle test

  • 影響が無意味なら、活性化のタイミングが互いに独立
  • 活性化時刻をシャッフルしても推定したαが似ていれば、社会影響の所為では無い!
    • ∵ i.i.d.なので、並び替えても同じ分布
  • 理論的解析もあるよ
    • 期待値よく集中している、みたいな
  • 例で説明…影響モデルならαがかなり異なる

Edge-reversal test

  • 辺の向きをひっくり返す
  • αはどんなもんでしょうか?

実験

シミュレーション

  • 生成モデル
    1. no-correlation:本当にランダム
    2. influence:
    3. correlation (no-influence):何かそれっぽい感じにとる
  • αのヒストグラムとCDFを出してみる、Shuffle testが上手く作動している

実データ

  • タグづけ行動のログを見てみる
    • 色んな成長パターンがある:bursty ("halloween"), smooth ("photos"), periodic ("moon")
  • 結論:相関はあるが、源≠影響

まとめ

  • 良い話

KDD 情報拡散 社会影響

2017/06/26

最終更新:2017年06月26日 12:58