我试图为一组用户在不同时刻提交的一组图片实现一系列功能。
如果群集发生变化,那么我们需要至少重新计算所有"视觉词"哪些元素已经改变了集群。
例如,假设时间d
的一个SIFT描述符t1
属于群集A
。在t1+1
处提交了一个查询,因此群集发生了变化,现在d
属于群集B
。所以我们需要重新计算"视觉词" (向量)相对于d
。
您可以想象,这种方法可能过于昂贵(特别是如果查询率很高)!
我的问题是:有一个比经典的词汇或一些动态聚类算法更好的模型吗?
答案 0 :(得分:1)
如您对其他问题的评论,假设视觉词语是在完整(多样化和大型)足够的数据集上进行培训。
如果每个有趣的关键点都有足够好的视觉词,那么您不需要更新视觉词,只需将新图像映射到现有词汇。
即使您假设数据不断变化,也无法始终更新词汇表。这是一个粗略的近似 - 重新计算后仍然只是一个粗略的近似。如果您收到实质数量的新数据,则可以更新。比这更频繁地更新可能会以巨大的成本产生0.0的改进。