我目前正在尝试使用TensorFlow对象检测API和更快的RCNN模型检测大图像(4000 x 4000像素)中的对象(实际上只有1个类)。
由于这些太大而无法直接用于训练和检测(在我的硬件上),因此我将图像裁剪为500 x 500像素的重叠子图像。总的来说这很有效但我有时会得到非常高分的假阳性(> 99%),我的猜测是我仍然可以改进学习策略。
所以我有两个问题:
答案 0 :(得分:1)
根据我的经验,以及Tensorflow中提供的数据集示例,如果不仅包括完全位于图像区域内的对象,甚至包含重叠裁剪图像的对象,您将获得更好的训练模型。这是为了避免过度拟合。