TF的量化脚本documentation似乎只包含--mode=eightbit
(2017年7月24日)。
每种模式用于什么?即如quantize_graph.py(圆形,量子化,权重,weight_rounded)所示:
flags.DEFINE_string("mode", "round",
"""What transformation to apply (round, quantize,"""
""" eightbit, weights, or weights_rounded).""")
作为一个补充问题,我试图追踪脚本并注意到eightbit
实际上并没有调用任何计算最小/最大值的函数(例如quantze_weight_eightbit)。那么mode = eightbit究竟做什么呢?