标签: tensorflow regularized
我在不同的应用程序中看到了为tf.contrib.layers.l2_regularizer设置的各种scale值。确定scale的价值是否有一般规则?例如,
tf.contrib.layers.l2_regularizer
scale
(1)我们是否需要考虑权重中的元素数量并使用scale对其进行标准化?
(2)如果均方误差(MSE)是损失的一部分,那么MSE和l2损失之间的适当比率是多少?