Sampling Community Structure

概要

X(S) = |N(S)|/|S|
- 隣接頂点数/頂点数
サイズkのサンプルSがcommunity representative sample
- minimize D[P_S(G(S)), P_S(G)]
  - D[,]は分割に対する距離尺度
  - P_S(G)はGを使って作られた分割

コミュニティ検出手法
- Girvan-Newman algorithm (GN)
- Newman’s leading eigenvector method (NLE)
- An algorithm based on greedy optimization (CNM)
評価基準
- 分割の距離関数D
  - 分割が同一になるようにするために削除する頂点数の最小値
  - サンプルから出来たコミュニティの頂点達が元のでかいグラフから出来た同じコミュニティに入っていると良い
- サンプル内のコミュニティの割合も考える
- ↑2つを混ぜるよ
- FRAC...recall
  - サンプル内のコミュニティの割合？？？（高いほうが良い
- PART...precision
  - 距離関数の値を正規化して1-xを計算（高い方が良い
- F-scoreを計算する
- Composite = (2FRAC+PART)/(FRAC+PART)

2013-12-31 19:17:44 (Tue)

タグ：

WWW community detection

最終更新：2013年12月31日 19:17