An Application of Boosting to Graph Classification

概要

ラベル付きグラフがL個あります
決定株$$ h_{\langle t,y \rangle}(\mathbf{x}) $$
- xについてある部分グラフyを含んでいたらyを返す
ものすごく弱いので、Boosting(特にAdaBoost)を適用
- 決定株をK個用意する
- $$ \mathrm{gain}(\langle t,y \rangle) = \sum_{1 \leq i \leq L} y_i d_i h_{\langle t,y \rangle}(\mathbf{x}) $$
- gainを上げる<t,y>を選んでいきながらdを更新
- $$\mathbf{d}$$はどの程度破ったかに応じて決める感じ（MWアルゴリズムで説明できる）

普通にこういうので良いのかな？
既存の機械学習の枠組みを適用するときの挑戦的部分がわかってきた気がする：
- どうやって特徴をとってくるか、を何らかの基準で測りたい
- 部分グラフ全列挙は大変なので、マイニング技法＋枝刈り（上限とか）を入れる
- ナイスなのがとってこれました！

2017/06/19

タグ：

NIPS グラフ分類 Boosting 特徴選択

最終更新：2017年06月19日 14:08