标签: gradient-descent convex-optimization convergence
是否有一些简单和简单的例子?强凸函数,其中Nesterov加速梯度法的收敛界限优于Nesterov对强凸案(sqrt(1 - 1 / sqrt(k)))的界限,并且比Nesterov的二次边界(1 - 1/ sqrt(k))更差。
(sqrt(1 - 1 / sqrt(k)))
(1 - 1/ sqrt(k))
其中,K = L/m表示条件比率
K = L/m