为什么Vgg16在每个卷积层之后都使用relu?

时间:2018-09-30 14:59:00

标签: gradient vgg-net relu

在CS231N课程中,它说我们希望以零为中心的数据来防止局部梯度始终与上游梯度下降相同,这会导致效率低下的梯度更新。但是在每层中使用relu会输出所有正数,如何解决效率低下的梯度更新问题?

0 个答案:

没有答案