我正在为视频分类创建一包视觉词。我没有使用SURF描述符,这就是为什么我不能将OpenCV的BOWImgDescriptorExtractor
用于此目的。
我提取了我的描述符,我自己将它们聚类。我现在有自己的词汇量(大小为4000)。我应该做的是将我的训练描述符分配给这些聚类,并为后续步骤创建可视直方图。我该如何进行预测,并从创建的字典中为我的训练数据创建视觉直方图?
答案 0 :(得分:0)
为了将描述符分配给群集,您必须选择距离度量。一个简单的选择是欧氏距离。然后,您需要计算从训练描述符到每个聚类质心的距离,并将它们分配给质心比任何其他聚类的质心更接近描述符的聚类。
对图像上的所有训练描述符完成后,计算分配给每个聚类的描述符数,然后构建直方图。但是,必须对训练集中的所有图像重复该过程。由于描述符的数量可能随图像而变化,因此直方图通常在被送入分类器之前被标准化为训练的特征向量。