TwitterRank: Finding Topic-sensitive Influential Twitterers
-
Jianshu Weng, Ee-Peng Lim, Jing Jiang, Qi He
-
WSDM 2010
概要
-
トピックを指定して影響力の高い頂点を見つけたい
-
応用
-
難しいところ
-
ユーザ同士の関係がnon-serious
-
トピックが分からん
-
ground truthとは…?
データ
-
シンガポールに限って
-
1000人位
-
割りと疎
-
ツイート数少ない?平均200とか
-
フォロー・フォロワー数は正の相関、せやな
-
フォロバは多い感じ
-
"Homophiliy"
Topic Distillation(上流
-
LDAってのをかける
-
前処理
-
3word以上
-
mention, URL, All-digit, Stopwordsは削除
-
10ツイート未満の人は省く
-
LDA (Linear Discriminant Analysis???)
-
上流の結果
-
D×T行列
-
D: ユーザ数
-
T: トピック数
-
何人がツイートしたか?
-
W×T行列
-
W: unique word
-
wordがトピックに割り当てられた回数を表す
-
Z 1×Nベクトル
-
仮説検定
-
トピック有りと無しでフォロー関係は似ているか?
-
トピック有りと無しで相互フォロー関係は似ているか?
-
結局Homophily性はあったよ
TwitterRank
-
ランダムウォークモデルで考えるよ!
-
類似度と正規化で2ノード間の確率を設定?
-
結局さっき定義した行列から作った式の反復計算
-
比較
まとめ
最終更新:2013年12月10日 18:17