标签: conv-neural-network gradient backpropagation
我尝试基于此article
现在,当我在CNN中的渐变上对其进行测试时,示例之间存在不一致之处。对于其中一些而言,通过了梯度检查,而对于另一些而言,则没有通过。
这是人们可以期待的吗?还是应该通过所有示例的梯度检查?另外,我可以使用数值方法对参数子集检查梯度还是仅对所有参数一次检查梯度?谢谢