在Bag of Features/Visual Words范例中,我们在V
中有一个向量k
- 维度,V[i]=j
如果是i
- 质心(由{{获得) 1}} - 表示算法)是所有k
- k
视觉描述符(例如SIFT描述符)的质心中最接近的一个。
AFAIK,由此产生的视觉向量非常稀疏(这意味着大多数条目都是0值),因为j
非常大,但我的问题是: {{}的合理值是什么1}}(以及矢量大小)?数百个维度?成千上万的?特别是考虑到k
- 意味着执行时间取决于k
。
答案 0 :(得分:0)
真的取决于你的数据。以下是经验法则:
K太小:您的群集不代表所有补丁。 太大K:你可能会得到量化伪像并且可能过度拟合。