From Machu_Picchu to rafting the urubamba river: Anticipating information ...

From Machu_Picchu to "rafting the urubamba river": Anticipating information needs via the Entity-Query Graph

  • Ilaria Bordino, Gianmarco De Francisci Morales, Ingmar Weber, Francesco Bonchi
  • WSDM 2013

概要

  • 今見ているwebページの内容から非自明かつ偶察力を有する少数かつ多様な検索クエリを提示
  • 手法
    • ページ内容をWikipediaエンティティで表現
    • エンティティとクエリからなるグラフ上で Personalized PageRank
    • PageRankスコアの高いクエリを出力
  • 実験
    • 提案手法の有用性を評価
  • Web 検索
    • 検索目的無しに蛇行
    • ⇨ 面白い情報が偶然発見
    • ⇨ ユーザの創造的洞察を支援
  • 今まで見たページから引き起こされるクエリの予想

Entity-Query Graph

  • クエリ→クエリ
    • query-flow graphと同じ
  • エンティティ→クエリ
    • クエリから関連するエンティティ(Wikipediaのページ)を抽出
  • エンティティ→エンティティ
    • クエリを介してつながるエンティティ

提案手法概要

  • 入力: Webページp(又はクエリ)
  • 手順1. pからシードエンティティXを抽出
  • 手順2. XをZに拡大
    • query-flow graph上でPersonalized PageRank
  • 手順3. Zに対するクエリQを抽出
    • EQGraph上でPersonalized PageRank

実験評価

  • 10人の査定者は…
  1. (URL, クエリ, クエリの検索結果)を与えられる
  2. URLのページを閲覧
  3. クエリの検索結果を閲覧
  4. 以下の3種類からクエリの質を評価
  • Related and Interesting
    • ページ内容から想起する興味・疑問に役立つ
  • Related but Obvious (自明)
    • ページ内容から想起する興味・疑問に役立たない
  • Unrelated
    • 無関係
  • 自明なのは減るが全く関係ないのが出ちゃう

まとめ

  • スムージングみたいな感じ

WSDM クエリ推薦

2014/12/30 22:12

タグ:

WSDM クエリ推薦
最終更新:2014年12月30日 22:14