标签: computer-vision object-detection
为什么选择计算机视觉中的Bag of Words方法?
例如:如果使用HOG特征作为描述符并对此特征应用BOW方法,则结果将是直方图的直方图。
我可以看到这种方法中降维的优点以及固定大小的生成箱,但这是否真的是唯一的原因?因为减少也会导致信息丢失。
我还可以考虑将图像调整为固定的,通常更小的尺寸并计算HOG。得到的矢量也具有固定的大小,因此它也可以与分类器一起使用。这也会导致信息丢失,特别是当固定图像尺寸非常小但不像k那样大幅度提升时。