标签: neural-network deep-learning caffe gradient-descent differentiation
我是caffe的新手。我有一个关于反向传播的多个顶层的问题,如下所示:
我的问题是,x_i w.r.t x_ {i-1}的区别是什么?
提前致谢。
xiaox