Piggybacking on Social Networks
-
Aristides Gionis, Flavio Junqueira, Vincent Leroy, Marco Serafini, Ingmar Weber
-
In VLDB 2013
概要
-
巨大なSNS
-
クラスタ係数を利用してスループット向上
-
↑最適化問題
-
アルゴリズム
-
O(log n)近似
-
Hadoop用のヒューリスティクス
スループット
定式化
-
Social Dissemination Problem
-
辺 u→v: vがuをフォロー
-
クエリ
-
Produce: 情報発信
-
Consume: フォローイングの最新情報を得る
-
スケジュール
-
Push edges
-
uv ∈ H: uがproduceしたらサーバvに保存
-
Pull edges
-
uv ∈ H: vがconsume したらサーバuから情報を得る
-
スコア
-
Push, Pullを上手く使うと、コストを減らせる
近似アルゴリズム (ChitChat)
-
NP-hard
-
集合被覆のO(log n)近似アルゴリズム
-
辺の選び方
-
ハブ固定したら、DensestSubgraph、多項式時間
ヒューリスティクス (ParallelNosy)
-
効率よさそうな部分集合を並列に探す
-
並列にconflictを解消
-
↑を繰り返す
Incremental updates
実験
設定
データセット
コスト関数
マシン環境
-
Hadoop cluster (1500 cores)
目的関数値
-
ベースラインに比べて半分
-
イテレーション1hour
実際のスループット
ParallelNosy vs ChiChat
VLDB system performance
2013-10-17 23:41:24 (Thu)
最終更新:2013年10月17日 23:41