我尝试使用tensorflow构建实现Yolo对象检测的网络,我希望它可以在Android上使用。构建结构后,我使用tf.train.write_graph来获取图形文件,并想要在android demo中替换原始文件。 但是pb文件太大(1.1G),在Android上无法使用。那么,我怎么能减小尺寸?
答案 0 :(得分:2)
我建议您先尝试量化图表,因为您只需要一个官方的TensorFlow脚本。这是Pete Warden的精彩教程: https://petewarden.com/2016/05/03/how-to-quantize-neural-networks-with-tensorflow/
理论上如果你使用32位浮点数,你的模型最终将减少约4倍(~250Mb),因为图中的值将被转换为8位整数(对于推断,它对性能没有显着影响) )。请注意,压缩协议缓冲区文件时会发挥作用。