标签: machine-learning neural-network artificial-intelligence gradient-descent mean-square-error
梯度下降作用于mean squared error方程,它是抛物线y=x^2的方程
y=x^2
我们经常说通过梯度下降算法在神经网络中进行权重调整会达到局部最小值并卡在其中。
我的问题是,抛物线方程的局部极小值怎么可能发生,其中斜率总是抛物线!