一袋视觉词编码过程

时间:2015-10-13 12:11:42

标签: image-processing computer-vision

在图像分类中,我必须在视觉词表示的包中编码图像并训练SVM分类器。制作视觉文字编码包的过程是什么?

1 个答案:

答案 0 :(得分:1)

以下是程序:

首先,你必须构建一个字典

  1. 首先,您必须在训练图像上应用采样(密集/关键点)。简单地将图像分解为等量采样的补丁。
  2. 对所有训练图像重复上一步。然后,对于每个路径,计算导致128-D向量的SIFT描述符。
  3. 对所有图像的所有色块执行上述步骤会产生一组128-D特征向量。将这些描述符聚类到K个簇中并保存它们的中心。这些中心构成了模型的可视化词典
  4. 构建视觉词典后

    1. 在目标图像上应用采样(密集/关键点)。

    2. 为查询图像的每个补丁计算SIFT特征描述符。

    3. 检查任何补丁所在的群集。选择这些群集的中心(可视单词)作为该补丁的代表。

    4. 计算目标图像中每个特定视觉单词编号的直方图。此直方图是图像的描述符/表示。

    5. 对于您的所有训练集,您可以训练任何现成的分类器来对图像进行分类。

      以下是管道的可视化:

      enter image description here