假设我想训练一个HOG描述符+线性SVM用于汽车检测。我是否有必要制作三个分类器,即汽车的后视图,前视图和侧视图,或者我可以为汽车的所有观点训练一个分类器?
答案 0 :(得分:1)
没有必要,但建议。您可以创建一个处理多个案例的分类器,但整体效果不佳。这里的问题不是不同视图之间的描述符响应的可变性,而是后/前向和侧向检测器之间的纵横比的差异。用于提取HOG的滑动窗口将捕获过多的负面(侧视图大小超过后/前)或者没有足够的正数据(后视/前视大小超过侧视图)。
底线:这取决于您的准确性/处理率要求。根据我的经验,前/后通常足够相似,但如果需要高精度,则每个都需要一个单独的探测器。您肯定需要一个单独的侧面探测器,甚至可能需要专用的“四分之一视图”探测器 - 右前,左前,右后,左后。
P.S。我省略了你还需要处理多个尺度的事实。