我正在尝试使用带有Tensorflow的渐变下降来做一个简单的线性回归问题,但除非我设置我的步长确实非常小,重量和偏置气球几乎立即溢出。这是我的代码:
// producer code, supposing it's also injected
this.animationService.loadServiceSubject.next(true);
所以基本上,当我运行它时,输出几乎立即成为“NaN”。有什么想法吗?
提前致谢!
答案 0 :(得分:1)
学习率非常低意味着权重的更新非常小。在你的情况下,即使相对较小的学习率也会增加你的权重,因为权重更新(dE / dW)似乎非常大。并且更新是输出错误的函数。如果标签值较大,则平方误差在开始时会很高,因为预测值非常低。尝试缩放输出以避免此问题。