提取图像属性

时间:2014-06-13 07:32:20

标签: image-processing computer-vision svm sift cbir

我正在做一个计算机视觉项目,我需要一些帮助。 我的项目的目标是提取任何物体的属性 - 例如,如果我有一个耐克跑鞋,我应该能够弄清楚它是一个鞋子,然后弄清楚它是一个耐克鞋而不是阿迪达斯的鞋子(可能是因为耐克蜱),然后弄清楚它是一个跑鞋而不是足球鞋钉。

我开始将此视为图像分类问题,我使用以下步骤:

  1. 我已经采用了训练样本(每个约60个)说鞋子,高跟鞋,手表,并使用Dense SIFT提取他们的特征。
  2. 使用k-means聚类创建词汇表(任意选择词汇表大小为600)。
  3. 为图像创建Bag-Of-Words表示。
  4. 训练SVM分类器以获得每个类别(鞋子,鞋跟,手表)的词袋(特征向量)。
  5. 为了测试,我提取了测试图像的特征向量,并从已创建的词汇表中找到了它的词袋表示。
  6. 我将测试图像的词袋与每个类的词组进行了比较,并返回了最接近的类。
  7. 我想知道如何从这里开始?使用D-SIFT进行特征提取是否可以帮助我识别属性,因为它只代表某些点周围的梯度?

    有时,我的分类出错了,例如,如果我使用左鞋和手表的图像训练分类器,右鞋被归类为手表。我知道我必须在我的训练集中加入合适的鞋来解决这个问题,但我还有其他方法吗?

    还有什么方法可以理解形状吗?例如,如果我已经训练了手表的分类器,并且训练集中有带圆形和矩形表盘的手表,我可以识别任何新测试图像的形状吗?或者我是否只为带有圆形和矩形表盘的手表单独训练? 谢谢

0 个答案:

没有答案