应用错误收集

我通过训练后量化解决了问题。由于我的最终目标是为移动设备训练Mdoel，而不是在训练过程中进行伪量化，因此我导出了keras .h5文件并直接转换为Tenforflow lite .tflite文件（post_training_quantize标志设置为true）。我在一个简单的cifar-10模型上进行了测试。原始的keras模型和量化的tflite模型具有非常接近的精度（量化的精度低一点）。

训练后量化：https://www.tensorflow.org/performance/post_training_quantization
将Keras模型转换为Tensorflow Lite：https://github.com/tensorflow/tensorflow/blob/master/tensorflow/contrib/lite/toco/g3doc/python_api.md 在这里使用了每晚tf的张量流：https://pypi.org/project/tf-nightly/

如果您仍然想进行假量化（由于某些模型，根据Google的说法，训练后量化可能会降低准确性），则原始网页已于上周关闭。但您可以从github找到它：https://github.com/tensorflow/tensorflow/tree/master/tensorflow/contrib/quantize

更新：事实证明，量化后并没有真正量化模型。 在推理过程中，它仍然使用float32内核进行计算。因此，我已转向量化感知训练。对于我的cifar10模型，准确性非常好。

我可以在Keras顺序模型中添加Tensorflow伪量化吗？

1 个答案: