是否可以重新量化已经量化的模型?
我有一些模型已经通过全整数量化进行了量化意识训练(QAT)训练。但是,我无法使用这些模型进行GPU委派。有没有办法使用 Float16 进行量化,以便能够使用 GPU Delegate 运行它们。
>答案 0 :(得分:0)
您是否正在寻找一些方法来转换float16量化模型的整数量化模型?
您正在使用哪个版本的TFLite? TFLite 2.3支持使用GPU委托运行量化模型。但是,由于GPU仅支持浮点运算,因此它会在内部将整数权重反量化为浮点权重。 请参阅文档以了解如何启用(实验)量化模型支持。 https://www.tensorflow.org/lite/performance/gpu_advanced#running_quantized_models_experimental