标签: gradient
我对这个包" neuralnet"感到困惑。 我想知道Neuralnet(R)中使用的梯度下降规则。
delta w(t)= -n(dE / dw)+ u(delta w(t-1)) 其中E =误差,w =重量,u是动量,n =学习率,t =时间
这是对的吗?