TF对象检测API:非常高分辨率图像中的推断

时间:2017-08-27 06:37:36

标签: tensorflow

我已经训练了一个模型(基于更快的rcnn)来识别1000x600图像中的80x80大小的对象。

当提供1000x600测试图像时,推理效果很好。

然而,我的最终目标是能够在非常高分辨率的照片中检测到这些物体(80x80)(5000x4000或更高,有时是其中的10倍)。

我有哪些选择?

我想的一种方法是将大图像分割成1000x600的较小图像并对它们进行推理。但是这种方法存在挑战。

任何人都试过这个用例并找到了可行的解决方案吗?

-

2 个答案:

答案 0 :(得分:0)

我要做的是:

  1. 缩小图像的大小5000x4000 - >为1000x600
  2. 预测物体;你会得到xminx, xmaxs, ymins, ymaxs - >按宽度和高度标准化它们以获得0和1
  3. 的值空间
  4. 拍摄原始图像并按原始宽度和高度重新标准化对象框
  5. 您建议的拆分图像方法也应该有效,但计算成本会更高。

答案 1 :(得分:0)

你可以:

  • 进行逐个补丁的推理并使用非最大限制来处理边界情况,或者

  • 通过填充使您的训练图像与测试图像的大小相同。

让我们知道你最终在做什么!