标签: neural-network gradient-descent
在karpathy关于政策梯度(http://karpathy.github.io/2016/05/31/rl/)的写得很好的帖子中,他提到了一个可区别的计算块"。
究竟是什么"可区别计算块"?