如何从求解器原型(CAFFE)更改特定图层的学习率

时间:2015-11-29 13:50:05

标签: deep-learning caffe

有人知道如何从求解器原型文件中更改CAFFE中特定图层的学习率lr_mult吗?我知道有base_lr,但是我希望定位特定图层的速率,并从解算器而不是网络原型文件中进行。

谢谢!

1 个答案:

答案 0 :(得分:1)

每个需要学习的层(即迂回,完全连接等)都有一个特定的lr_mult参数,可以专门为该层控制。 lr_mult是此参数全局学习率的乘数。"

只需在lr_mult中为您的图层定义或更改train_val.prototxt

这对于微调非常有用,您可能希望仅为新图层提高学习速度。

有关详细信息,请查看caffe fine-tuning教程。 (注意:它有点过时,在那里使用已弃用的术语blobs_lr而不是lr_mult

编辑:据我所知,无法根据solver.prototxt定义特定于图层的学习率。因此,假设solver.prototxt限制不严格,我建议采用不同的方法来实现相同的结果。