标签: python tensorflow deep-learning conv-neural-network
我有一个冻结的图形,我导入到TensorFlow的PB文件,目前所有的数据类型和操作都是在float32中完成的,我怎样才能将所有内容转换为float16,甚至是乘法,卷积等操作?
答案 0 :(得分:0)
您可以看看Tensorflow的quantization tool:它确实做到了这一点,还有更多(可选)优化,可以进一步减小模型的大小并提高推理时间。