在滑动窗口物体探测器中,是否可以“智能地”进行物体检测?例如,如果一个人在寻找车辆,他们就不会在天空中寻找汽车。但是使用滑动窗口的对象检测器将在整个图像(包括天空)上滑动窗口并在每个窗口上运行对象分类器,从而导致大量浪费的时间。是否有任何技术可以确保它只在合理的位置看起来?
我知道我们必须至少查看一次所有内容,但我不想在每个窗口上运行一个繁重的复杂分类器。也许是一种预先分类的分类器?
答案 0 :(得分:2)
您是否考虑过查看显着性检测算法?显着性检测算法可以指示人类最有可能关注的图像中的位置。一个很好的例子就是开放领域的人类。天空将具有低显着性,而人类则高。
可能首先通过显着性检测算法放置图像,然后是阈值并找到搜索位置的区域而不是整个图像。
一个很好的算法是Stas Goferman:上下文感知显着性检测 - http://webee.technion.ac.il/~ayellet/Ps/10-Saliency.pdf。
这里还有一些代码可以帮助您入门:https://sites.google.com/a/jyunfan.co.cc/site/opensource-1/contextsaliency
不幸的是它在MATLAB中,并且从你的标签中你想看看Python。但是,numpy / scipy
和MATLAB之间有许多相似之处,所以如果你想要转录任何代码,这对你有帮助。
看看吧!