标签: machine-learning neural-network
我正在学习课程的反向传播。 在其中他们说反向传播一次只能在一个训练样例上完成。 可以在此链接中找到此说明 https://www.coursera.org/learn/machine-learning/lecture/1z9WW/backpropagation-algorithm(9分钟)。
然而我正在乱搞dl4j。 在DL4j中,似乎他们正在使用批处理。 在后面的传播中,他们似乎一次处理一批。
这怎么可能?
据推测,他们必须能够为每一层矢量化下面的操作? image link here