我正在使用视觉词汇来聚集图像的特征。到目前为止,我遇到的所有工作都使用了BOW来聚类使用SIFT,SURF等计算的特征。也许我错过了这个但是可以在BOW中将颜色直方图特征表示为BOW还有边缘直方图特征。
我正在研究图像分类器,我想使用带有RGB颜色直方图的SIFT作为Opencv中的特征描述符。所以我想知道将2个特征向量连接成一个并添加到BOW是正确的,或者将SIFT特征添加到BOW并将直方图特征连接到BOW是正确的(我现在使用此模型但我想知道哪个一个是正确的。)
答案 0 :(得分:0)
历史上,我们使用词袋模型进行文档检索。 正如本post所述,在计算机视觉中,视觉词袋是指特征包(BOF)。如果要使用两种类型的要素,可以连接两个要素向量并构建BOF模型。 (例如,)对于人类动作识别任务,人们通常使用基于外观特征(Gradient-HOG)和运动特征(光流 - HOF)的串联构建的BOF来模拟人类动作。