梯度下降中局部极小值怎么可能?

时间:2019-04-23 08:17:54

标签: machine-learning neural-network artificial-intelligence gradient-descent mean-square-error

梯度下降作用于mean squared error方程,它是抛物线y=x^2的方程

我们经常说通过梯度下降算法在神经网络中进行权重调整会达到局部最小值并卡在其中。

我的问题是,抛物线方程的局部极小值怎么可能发生,其中斜率总是抛物线!

0 个答案:

没有答案