标签: tensorflow object-detection tfrecord
为什么我们将整个图像放在tfrecord文件中?为什么不根据边界框裁剪图像并将裁剪的对象放在tfrecord文件中?这应该会大大减小该文件的大小。
答案 0 :(得分:0)
因为您想学习检测图像中对象的位置。在图像分类中,您可以按照建议切出图像,然后网络输出" car"或"不是汽车"。在对象检测中,网络将输出对象的边界框以及类。 ("汽车位于x1-x2-y1-y2")它通过将整个图片与损失函数的边界框进行学习。