我正在编写自己的HoG用于将来的修改目的,并尝试不同的方法。但我偶然发现了这个问题。
我已经从INRIA下载了数据集,并且有320 x 240的图像。而HoG的默认培训窗口大小是64 x 128.我该如何解决这个问题?
对于正像,它们大约是96 x 160像素,我所做的是将它们调整到64 x 128.但是对于较大的图像,我要调整它们的大小,使用逐个像素移动的滑动窗口,或者我是否计算了那张大图像中64 x 128补丁的特征?
答案 0 :(得分:4)
答案完全取决于您的应用领域以及您对这些图像的了解。我之前没有玩过INRIA,但是......
1)您尝试查找的对象是否大小相同,并且在所有图像中的相同位置?然后固定大小,固定位置设置为64x128可能没问题。
2)您试图在各种图像中的不同位置找到大小相同的物体吗?然后滑动窗口可能会工作。
3)您是否希望对象改变大小并填充总图像的不同百分比?然后你需要做一些能够减轻尺度和位置变化的东西,使用图像金字塔或其他尺度不变的技术(你可以通过将图像调整为几个中间尺寸并运行滑动窗口版本来实现这一点。每个)。
另外,这是用于训练分类器吗?如果是这样,您需要一种方法来标记适当的比例和位置,和/或解决多实例学习问题。如果你只想运行,你需要一种方法来做出声明并自己得分......
很多有趣的事情!