我倾向于使用HSV作为表示每个像素的特征,然后我可以使用词袋模型进行进一步处理,例如分类。
我从论文[1]
中读到了这个使用HSV的多变量直方图对每个区域建模 其像素值,其中8个区用于H通道,3个区用于 S和V通道中的每一个,产生72维特征 矢量。
我知道使用matlab或python很容易获得图像的图像颜色空间,但我混淆了如何获得如上所述的72-dim特征向量。任何现有的代码都可以做到这一点(在matlab中更好)?
[1]:使用区域袋表示的场景分类,CVPR 07
答案 0 :(得分:4)
由尺寸为8,3和3的3个子向量组成的72维向量意味着:
对于通常给出360度值的Hue色彩空间,您将其量化为8个区间。那是每箱360/8 = 45
:
0-45
获得价值0
46-90
获取值1
等。
类似于饱和度(通常得到值0-1
)和值(0-1
)表示每个bin获取值:
1/3 = 0.3333
。
0-0.333
获得值0
0.334-0.666
获得值等等。
最后你连接它们,你得到一个72暗淡的矢量。