标签: tensorflow deep-learning
tensorflow的GradientDescentOptimizer是逐层训练内部网络还是只使用像Back back这样的常规方法。 GradientDescentOptimizer的网络有多深?
答案 0 :(得分:1)
它只是使用标准后支撑,而不是逐层。
理论上,网络可以在内存中保存。但它越深入训练所需的时间越长,连续层次越少越有用。在某个时刻,额外的层甚至可以开始增加训练数据的误差。