我在tensorflow/models repo。
中将此问题作为问题发布我从头开始训练inception model我自己的数据集只包含两个类,我注意到当我开始使用带有use_batch_norm参数的批量标准化时,验证准确率约为50%~60%准确率接近100%,这种糟糕的准确几乎只是在猜测。它看起来像过度拟合,当我关闭use_batch_norm时,验证准确度很快就接近100%。
所以我的问题是批量标准化究竟是如何导致这种情况的?有关如何处理它的任何想法?我尝试了一堆批量规范的超参数,似乎没有帮助。
由于