应用错误收集

我的目的是发现一些水下物体-羽毛球拍等。我有160张以上的球拍躺在水下的图像。我为此球拍对象（我要检测的对象）创建了二进制蒙版，然后根据该球拍蒙版计算了水下的风景蒙版（岩石，树叶等，我不想检测的对象）。现在我想使用BOF进行高密度筛分。我打算做什么：

创建一个可视词典-应用球拍蒙版然后在背景蒙版上对图像进行密集的SIFT计算（在我正在两次计算SIFT的每个图像上-对于要检测的对象（球拍）和所有其他水下物体
具有字典，我必须计算我的SVM训练数据-因此，对于每个图像，我再次应用对象蒙版（并将其标记为1）和应用背景蒙版（标记0）来计算SIFT-我正在计算频率（直方图）字典中的视觉单词。
对象识别-这部分对我来说很棘手。我训练有素的svm知道球拍（标签1）和背景（标签0）的字典视觉单词频率。现在，我有一张要在上面测试我的SVM的图像-球拍在某些岩石和其他东西之间铺设在水下。当我将这些数据放入SVM时，它将检测到“两个频率的视觉单词”-因为图像上是我的球拍，并且也有背景。它正在检测这两件事。现在我该如何预防呢？我的想法是分割要在几个（10-50）区域上分类的图像，然后在每个区域上计算密集SIFT，然后基于这些区域上的密集筛分进行svm预测？

我是对的，还是我对这种BOF方法有误解。如果我错了，我该如何实现自己的目标。我再次拥有160套图像（原始框架，球拍上的面具，背景上的面具）。