QAT模型的准确性低于火车后量化模型

时间:2020-06-25 12:04:50

标签: python tensorflow quantization tf-lite quantization-aware-training

TensorFlow版本(从源代码或二进制安装):2.3.0.dev20200609(二进制)

TensorFlow模型优化版本(从源代码或二进制文件安装):0.3.0(二进制文件)

Python版本:3.6.9

我正在尝试比较基本keras模型的结果和两个量化变量(QAT和只是训练后量化),我设法获得了两个模型,但是问题是训练后模型显示出更好的结果(边际下降与基本模型相比)。现在人们会认为QAT方法会更好,但问题是该模型显示损失增加了约30-35%。这两个脚本都是按照TF网站上的官方指南制作的。单独的模型真的很基础(很少有CNN块和3个Dense层的分支。如有必要,我可以发布代码片段。我使用QAT尝试了多种方法:尝试使用起始lr,我正在使用的子集的大小,对模型的架构稍作更改。

最让我感到困惑的是,我会理解,如果训练后的量化结果同样糟糕或较差,但它们接近完美,那么QAT的结果就很糟糕,所以我不知道为什么优质的解决方案会更糟在这种情况下一个。

0 个答案:

没有答案