标签: conv-neural-network
如果Batch Norm的目的是规范对下一层的输入,那么引入可学习/可训练的参数(Gamma和Beta)的目的是什么?
答案 0 :(得分:0)
我可能在这里找到了答案-https://kratzert.github.io/2016/02/12/understanding-the-gradient-flow-through-the-batch-normalization-layer.html