一袋字 - 图像分类

时间:2012-12-14 11:10:16

标签: machine-learning computer-vision

我对基于图像分类的单词包含一些疑问,我将首先告诉我做了什么

  1. 我使用SURF方法从训练图像中提取了两个不同类别的特征,

  2. 然后我对这两个类别的功能进行了聚类。

  3. 为了将我的测试图像(即)分类到测试图像所属的两个类别中。为了这个分类的目的,我正在使用SVM分类器,但这里是我有疑问的,我们如何输入测试图像我们是否必须再次从1到2执行相同的步骤然后将其用作测试集或者是否存在任何其他方法,

  4. 也很高兴知道弓法的效率,

  5. 好的,有人给我一个澄清

1 个答案:

答案 0 :(得分:10)

分类器需要测试数据的表示与训练数据具有相同的含义。因此,当您评估测试图像时,您将提取特征,然后根据原始词汇表中的哪些单词最接近直方图。

那是:

  1. 从整个训练集中提取功能。
  2. 将这些功能集中到词汇表V中;你得到了K个不同的集群中心。
  3. 将每个训练图像编码为每个词汇元素在图像中显示的次数的直方图。然后每个图像由长度为K的矢量表示。
  4. 训练分类器。
  5. 给定测试图像时,提取特征。现在将测试图像表示为来自V的每个聚类中心最接近测试图像中的特征的次数的直方图。这又是一个长度K向量。
  6. 通过获取条目的平方根来折扣直方图通常也是有帮助的。这个approximates a more realistic model用于图像功能。