我是caffe的新手,当我训练我的模型时,我遇到了一个奇怪的事情。对于tge相同的求解器原型,如果我在没有预列车模型的情况下进行训练,其测试精度可以增加到0.9+,但是如果我使用预列车模型进行微调,则其准确度在0.5-0.6之间波动。如何解决问题,使微调模型测试精度提高到0.9?
以下是我的命令和配置文件:
1列车:
./ build / tools / caffe train --solver = solver_cmp.prototxt -gpu 0
2微调:
./ build / tools / caffe train --solver = solver_cmp.prototxt --weights = pruned_sqznet.caffemodel -gpu 0
3 solver_cmp.prototxt
net:“pruned_sqznet.prototxt”
test_iter:80
test_interval:100
base_lr:0.01
输入:“Nesterov”
显示:40
max_iter:100000
iter_size:16 #global batch size = batch_size * iter_size
gamma:0.0001
lr_policy:“poly”
功率:1.0#线性降低LR
势头:0.9weight_decay:0.005
快照:10000
snapshot_prefix:“examples / crowd / models / cmp_fine”
random_seed:42
solver_mode:GPU
average_loss:40