TwitterRank: Finding Topic-sensitive Influential Twitterers - todo314 @ ウィキ - atwiki（アットウィキ）

todo314 @ ウィキ

todo314 @ ウィキ

TwitterRank: Finding Topic-sensitive Influential Twitterers

TwitterRank: Finding Topic-sensitive Influential Twitterers

Jianshu Weng, Ee-Peng Lim, Jing Jiang, Qi He
WSDM 2010

ビデオ見て書いてみたよ
- http://videolectures.net/wsdm2010_weng_trft/

概要

トピックを指定して影響力の高い頂点を見つけたい
応用
- leaderの特定
- マーケティング、広告
難しいところ
- ユーザ同士の関係がnon-serious
- トピックが分からん
- ground truthとは…？

データ

シンガポールに限って
1000人位
割りと疎
ツイート数少ない？平均200とか
フォロー・フォロワー数は正の相関、せやな
フォロバは多い感じ
"Homophiliy"

Topic Distillation（上流

LDAってのをかける
- 集まっているツイートがコンテンツ？
前処理
- 3word以上
- mention, URL, All-digit, Stopwordsは削除
- 10ツイート未満の人は省く
LDA (Linear Discriminant Analysis???)
上流の結果
- D×T行列
  - D: ユーザ数
  - T: トピック数
  - 何人がツイートしたか？
- W×T行列
  - W: unique word
  - wordがトピックに割り当てられた回数を表す
- Z 1×Nベクトル
  - N: word数
  - トピック割当
仮説検定
- トピック有りと無しでフォロー関係は似ているか？
- トピック有りと無しで相互フォロー関係は似ているか？
- 結局Homophily性はあったよ

TwitterRank

ランダムウォークモデルで考えるよ！
類似度と正規化で2ノード間の確率を設定？
結局さっき定義した行列から作った式の反復計算
比較
- レコメンデーションで性能を比較

考察
- いいらしい？

まとめ

割りとよくある話しに感じた

タグ：

WSDM Twitter

「TwitterRank: Finding Topic-sensitive Influential Twitterers」をウィキ内検索

最終更新：2013年12月10日 18:17