标签: python machine-learning deep-learning caffe
我正在使用caffe进行深度学习,并希望制作一个python softmaxwithloss图层(可能没有意义,但我想尝试)。问题是我的层在训练阶段的后退部分不起作用(在数据中得到NAN)。
问题是:培训的落后工作如何?每一层都学习它的差异(caffe.Layer [0] .diff或类似的东西)并将其传达给下一层吗?所以唯一要做的就是计算每个底层的差异,这可以使后向工作吗?
非常感谢
答案 0 :(得分:0)
您可以阅读并找到有关Caffe模型解剖的更多信息here。
这是Caffe技术的另一个tutorial:基本命令,Python和C ++代码。