tensorflow - 为什么要将整个图像放在tfrecord文件中？为什么不根据边界框裁剪并将裁剪的对象放在tfrecord文件中？ - Thinbug

为什么要将整个图像放在tfrecord文件中？为什么不根据边界框裁剪并将裁剪的对象放在tfrecord文件中？

时间：2018-01-21 07:18:42

标签： tensorflow object-detection tfrecord

为什么我们将整个图像放在tfrecord文件中？为什么不根据边界框裁剪图像并将裁剪的对象放在tfrecord文件中？这应该会大大减小该文件的大小。

1 个答案:

答案 0 :(得分：0)

因为您想学习检测图像中对象的位置。在图像分类中，您可以按照建议切出图像，然后网络输出＆＃34; car＆＃34;或＆＃34;不是汽车＆＃34;。在对象检测中，网络将输出对象的边界框以及类。（＆＃34;汽车位于x1-x2-y1-y2＆＃34;）它通过将整个图片与损失函数的边界框进行学习。