先日のNIPS2016読み会で、勾配法における変数の適応的な更新方法をLSTMで学習して使うという論文があったけど、 同じようなことをSATソルバやMIPソルバに対してできないかなぁ。
これらのソルバは探索の最終的な完全性こそ保証されているものの、実際の探索の振る舞いは多くのヒューリスティクスによって制御されているので、それらヒューリスティクスを機械学習に基づいたものに置き換えられないか。 例えば、リスタート戦略とか、変数や学習節の重要度の評価とか……
Learning to learn by gradient descent by gradient descent
https://papers.nips.cc/paper/6461-learning-to-learn-by-gradient-descent-by-gradient-descent
http://www.slideshare.net/fukuda18/learning-to-learn-by-gradient-descent-by-gradient-descent