Escaping from Saddle Points http://www.offconvex.org/2016/03/22/saddlepoints/ 置換対称性に起因する非凸性の話とか、 非凸な問題でSGDが noisy gradient descent  として機能して収束に貢献するという話がちょっと面白かった。