Modeling Information Diffusion in Implicit Networks

Modeling Information Diffusion in Implicit Networks

  • Jaewon Yang, Jure Leskovec
  • ICDM 2010

概要

  • 基本的にunderlyingなグラフは分からん
  • グラフ構造っぽいのを使わずにモデリング
  • Linear Influence Model

Linear Influence Model 定式化

  • 仮定
    • uがアクティブになった時刻
    • これだけ、リンク関係は謎
  • V(t): 時刻tに情報に言及した頂点の数
  • I_u(l): 頂点uが言及してから影響を受けてl時間後の言及した頂点の数
  • A(t): 時刻tまでにアクティブになった頂点の集合
  • M_u,k(t): 時刻tまでにuがアクティブなったら1
  • $$ V(t+1) = \sum_{u \in A(t)}I_u(t - t_u) $$
  • 難しいのは?
  • I_u(l) のモデリング
    • ノンパラメトリックアプローチだよ~
    • 長さL
  • $$ V_k(t+1) = \sum_{u=1}^{N}\sum_{l=0}^{L-1}M_{u,k}(t-l)I_u(l+1) $$
  • 上の式は行列で書けるので割りと簡単に解ける
  • けど、ノイズがあるので困ったマン
  • minimize ||V-MI||_2
  • subject to I >= 0
    • Non-Negative Least Squaresなので、既存のいい感じの手法をつかえばよい
  • 拡張もしちゃう
  • α-LIM
    • 目新しさの効果
      • influenceへの言及が早くても遅くても影響力が変わらんので不自然
    • α(t)を掛ける
    • α(t): 小さく始まって、ピークに達して、ゆっくり減少
  • B-LIM
    • 模倣の効果
    • b(t)を足す

実験

  • Memetracker
    • 170Mメディア
  • Twitter Hashtag
    • 500Mツイート
  • 5種類のメディア
  1. Newspapers (New York Times, USA Today)
  2. Professional blogs (Salon, Huffingtonpost)
  3. TV stations (ABC, CBS)
  4. News agencies (AP, Reuters)
  5. (personal) Blogs
  • influence functionの形はトピックによって違うっぽい

まとめ

  • リンク関係とは何だったのか…。

ICDM information diffusion

2014-01-12 23:29:12 (Sun)

最終更新:2014年01月12日 23:29