Information Diffusion and External Influence in Networks

Information Diffusion and External Influence in Networks

  • Seth Myers, Chenguang Zhu, Jure Leskovec
  • In KDD 2012

メモ

アブスト

  • influence の始まりってどこ?ってのを考える
  • influence の伝わり方は2パターンある
    • ノード-ノードを伝って
    • ネットワーク外から
      • これに注目
  • 新しいモデル
    • フィッティングしやすいパラメータ
  • Twitterに適用
    • 完全なひと月のデータ
    • 情報がネットワークをジャンプしている
      • これはネットワーク外からの情報を反映
  • 以下が明らかに!!!
    • 内部: 71%
    • 外部: 29%

定義された用語

  • exposures: ノードが情報をゲット
  • infections: その情報をツイートした
  • exposure curve: ノードがexposureされた回数からそのノードがinfectする確率
    • あるところから、情報を見る度に目新しさが無くなる
    • ともーじゃん?
    • 学術的内容だったら、どんどん知識が増えていくので確率が増える
    • これを上手く推定する
  • contagion: 何か出現した情報

提案モデル

先に記号を定義

Event Profile

  • 時刻tで外部からもらう確率
  • $$ \lambda_{ext}(t) $$

Internal Hazard Function

  • 近傍に伝搬させる確率みたいな
  • $$ \lambda_{int}(t) $$

Exposure Curve

  • $$ \eta(x) = \frac{\rho_1}{\rho_2}x \exp\left( 1-\frac{x}{\rho_2} \right) $$
  • exposureに従い採用する確率
  • ρ2で最大値ρ1をとる
    • ρ2まではlogっぽく上がる
    • ρ2からは指数関数っぽく下がる

Exposure Distribution

  • ノードiがn exposureを時刻tまでにもらう確率
  • $$ P^{(i)}_{exp}(n;t) $$

ネットワーク内部

  • influence と同じ感じ
  • hazard function なるものを使う
    • 病気の伝播の表現に使われたらしい
  • internal hazard function
  • $$ \lambda_{int}(t)dt $$

ネットワーク外部

  • event profile で
  • $$ \lambda_{ext}(t)dt $$

パラメタ推定

  • $$ \lambda_{ext}(t), \rho_1, \rho_2 $$ を推定しよう
  • 色々頑張る、めんどいので略

実験

人工データ

  • 何か上手いことフィットしているっぽい

実データ

  • ρの値について結構調べている
  • 29%はネットワーク外!!

結論

  • We should emphasize that our model does not only reliably capture the external influence but, as a consequence, also leads to a more accurate description of the real network diffusion process.

メモ

  • スライドを先読んでたからかもしれんが全体的に構成がうまお
  • モチベーションが有って(外部からの情報を考慮
  • 妥当にモデリングして(関数ね
  • フィッティングできる
  • で、実データから新たな知見を得る

KDD information diffusion

2013-10-16 03:19:42 (Wed)

最終更新:2013年10月16日 03:19