一袋词表示

时间:2015-05-12 14:20:06

标签: matlab image-processing machine-learning computer-vision image-segmentation

我想为我的项目实现单词表示。我通过使用它们的特征和描述符来计算图像视觉词的码本。然后,我使用k-means获得了聚类中心。对于单词表示部分,要求您使用作为数据集一​​部分提供的手动标记的段。在数据集中,每个图像有三种不同的二进制掩码。那些标记的段是二进制掩码吗?如果是这样,我将如何使用计算的视觉词?

1 个答案:

答案 0 :(得分:0)

单词包方法提供图像或图像的一部分的简洁表示。该表示通常用作分类算法的输入,该分类算法用于估计图像数据所属的类。通常,分类器是监督学习方法,其将需要在训练过程期间来自一些训练集的对(描述符,标签)。在您的情况下,描述符是来自训练集的图像数据的BOW表示。然后,在测试期间,您将向分类器提供新图像数据的BOW描述符以推断该类。

根据我的理解,你有三个不同的图像掩码,这意味着你还有三个类。然后,每个掩码将告诉您图像的哪个部分应被视为属于特定类的图像数据。这是您的训练数据。

在此假设下,您应提取与每个蒙版对应的图像部分,计算这些图像部分的BOW表示(分别针对每个蒙版),并使用具有蒙版编号的那些作为标签来训练分类器。

这样您以后可以使用使用滑动窗口方法将测试图像的部分分类为属于训练期间使用的3个类别之一。这将是检测问题的简单情况。

我不确定我是否正确理解了您的问题,但我希望这会帮助您向前迈进一步。