TwitterRank: Finding Topic-sensitive Influential Twitterers

TwitterRank: Finding Topic-sensitive Influential Twitterers

  • Jianshu Weng, Ee-Peng Lim, Jing Jiang, Qi He
  • WSDM 2010

概要

  • トピックを指定して影響力の高い頂点を見つけたい
  • 応用
    • leaderの特定
    • マーケティング、広告
  • 難しいところ
    • ユーザ同士の関係がnon-serious
    • トピックが分からん
    • ground truthとは…?

データ

  • シンガポールに限って
  • 1000人位
  • 割りと疎
  • ツイート数少ない?平均200とか
  • フォロー・フォロワー数は正の相関、せやな
  • フォロバは多い感じ
  • "Homophiliy"

Topic Distillation(上流

  • LDAってのをかける
    • 集まっているツイートがコンテンツ?
  • 前処理
    • 3word以上
    • mention, URL, All-digit, Stopwordsは削除
    • 10ツイート未満の人は省く
  • LDA (Linear Discriminant Analysis???)
  • 上流の結果
    • D×T行列
      • D: ユーザ数
      • T: トピック数
      • 何人がツイートしたか?
    • W×T行列
      • W: unique word
      • wordがトピックに割り当てられた回数を表す
    • Z 1×Nベクトル
      • N: word数
      • トピック割当
  • 仮説検定
    • トピック有りと無しでフォロー関係は似ているか?
    • トピック有りと無しで相互フォロー関係は似ているか?
    • 結局Homophily性はあったよ

TwitterRank

  • ランダムウォークモデルで考えるよ!
  • 類似度と正規化で2ノード間の確率を設定?
  • 結局さっき定義した行列から作った式の反復計算
  • 比較
    • レコメンデーションで性能を比較
  • 考察
    • いいらしい?

まとめ

  • 割りとよくある話しに感じた

タグ:

WSDM Twitter
最終更新:2013年12月10日 18:17