有没有办法进行以下过程: https://www.tensorflow.org/performance/quantization
电话:
tf.contrib.quantize.create_eval_graph()
可以通过以下调用方式进行调整吗?
https://www.tensorflow.org/versions/master/api_docs/python/tf/quantize
我希望将权重缩放到具有对称范围的8位,精确0和最大/最小为功率2,就像 SCALED 模式一样。例如,我更喜欢-31到31而不是-10到30.即使-10到30会在8位时提供更好的分辨率,但准确度为0,对称性和范围为2的幂对于DSP设备更为重要。
答案 0 :(得分:0)
TOCO(tf.lite.TocoConverter)到目前为止还没有控制量化类型的选项,因为您实际上想要的是对称量化而不是非对称方法。但是,在量化过程中,可以保证真实值0.0为accurate。这意味着0.0映射到uint8 q时没有任何舍入错误。