我在CS231n class中了解到,在测试期间,我们需要通过我们用作训练辍学概率的相同因子来扩展激活。在张量流中使用DropoutWrapper时,我没有看到任何允许我进行此测试时间缩放的参数。
为什么会丢失?是否有必要使用RNN?什么是正确的方法?
答案 0 :(得分:0)
您不需要根据推断进行缩放,因为tf.nn.dropout
在列车时间应用了比例(来自tf.nn.dropout documentation):
概率
keep_prob
,输出按1 / keep_prob
放大的输入元素,否则输出0
。缩放是为了使预期的总和不变。