应用错误收集

一袋视觉词编码过程

时间：2015-10-13 12:11:42

标签： image-processing computer-vision

在图像分类中，我必须在视觉词表示的包中编码图像并训练SVM分类器。制作视觉文字编码包的过程是什么？

1 个答案:

答案 0 :(得分：1)

以下是程序：

首先，你必须构建一个字典

首先，您必须在训练图像上应用采样（密集/关键点）。简单地将图像分解为等量采样的补丁。
对所有训练图像重复上一步。然后，对于每个路径，计算导致128-D向量的SIFT描述符。
对所有图像的所有色块执行上述步骤会产生一组128-D特征向量。将这些描述符聚类到K个簇中并保存它们的中心。这些中心构成了模型的可视化词典。

构建视觉词典后

在目标图像上应用采样（密集/关键点）。
为查询图像的每个补丁计算SIFT特征描述符。
检查任何补丁所在的群集。选择这些群集的中心（可视单词）作为该补丁的代表。
计算目标图像中每个特定视觉单词编号的直方图。此直方图是图像的描述符/表示。

对于您的所有训练集，您可以训练任何现成的分类器来对图像进行分类。

以下是管道的可视化：