标签: python-3.x deep-learning
在ANN模型的测试时间,我们不使用辍学,因为我们不需要在测试过程中对模型进行正则化,但是我们仍将输出缩小比例等于辍学率。
要平衡一个事实,即与训练时相比活跃的单位更多。
Ref:欣顿阴谋论纸
我的问题是为什么我们需要保持平衡? (如果测试数据更多,则在已经训练好的模型上应该没有任何区别。)