我正尝试通过量化意识训练来训练模型,以便以后可以将其转换为用于边缘tpu加速器的quant.tflite。我使用ssd_mobilenet_v1_coco
作为预训练模型,并下载了ssd_mobilenet_v1_quantized_coco
的配置文件。当我删除此内容时:
graph_rewriter {
quantization {
delay: 48000
weight_bits: 8
activation_bits: 8
}
}
从配置文件中,模型需要0.2秒的时间。使用该量化线,最多需要1.1秒的时间。