我正在使用张量流对象检测api(https://github.com/tensorflow/models/tree/master/research/object_detection)来使用单次多盒检测器(SSD)训练CNN,然后检测图像/视频中的对象。有什么方法可以在网络中实现热图以提高模型的准确性?如果没有,你能否建议我改进模型的其他方式?
提前致谢
答案 0 :(得分:2)
答案取决于您真正想从这项工作中学到什么。 如果您只是想要一个可以正常运行的模型,而又不了解幕后发生的事情,我建议您尝试一些高级服务,例如Google Cloud Platform的AutoML。
相反,如果您对背后的技术感兴趣,则应先阅读原始的SSD纸,以深入了解其工作原理。 之后,您可以尝试使用在.config文件中找到的参数。
我个人将从改变特征提取器开始,以使用比MobileNet(快速但不准确)更准确(但可能更慢)的特征提取器,例如VGG16或ResNet。
然后,您可以尝试始终从.config文件中更改锚点的大小及其形状。
但是,我真的建议不要使用反复试验的方法,因为您很有可能最终会浪费大量时间等待培训结束。有一些简单但有用的技术可以避免这种情况: 例如,我建议您尝试使用最强大的配置,而无需进行正则化,以查看长期的培训是否能够生成至少适合您的数据集并在该数据集上运行良好的模型。如果这不起作用,则意味着您的网络不够深/不够大,您应该对此进行努力。
根据我的亲身经历,我发现对图像进行预处理的效果不如预期,特别是在使用迁移学习时。