我有一个网络。在一个地方我想使用concat。就像这张照片。
不幸的是,网络没有训练。要理解我为什么要在concat中更改权重。这意味着FC4096的所有值都将为1,FC16000的所有值将在开始时为0。
我知道FC4096会让我获得57%的准确率,所以学习率为10 ^ -6我会理解为什么在连接层没有学习之后。
问题是,如何将FC4096中的所有值设置为1,将FC16000中的所有值设置为0?
答案 0 :(得分:3)
您可以在FC16000
之上添加"Scale"
图层并将其初始化为0:
layer {
name: "scale16000"
type: "Scale"
bottom: "fc16000"
top: "fc16000" # not 100% sure this layer can work in-place, worth trying though.
scale_param {
bias_term: false
filler: { type: "constant" value: 0 }
}
param { lr_mult: 0 decay_mult: 0 } # set mult to non zero if you want to train this scale
}