K-means树VS随机KD树?

时间:2016-10-03 10:54:22

标签: tree k-means kdtree

我正在阅读these张幻灯片。特别是,在幻灯片52中,它表示:

  

在我们的实验中,我们发现两种算法中的任何一种都可以   具有最佳性能,具体取决于数据集和所需   精度

然而,在上一张幻灯片中仅在以下情况下(a)K-means树比随机kd-tree具有更好的性能,而在其他三个实验中kd-tree绝对是胜利者。

这是正确的还是我在这里读错了?如果是这样,他们为什么说最好的算法依赖于数据集?

1 个答案:

答案 0 :(得分:0)

在分析了您指向的幻灯片中的图表后,您可以观察到:

  • 在(a) for 100k SIFT匹配 K-means执行得更好时平衡速度/精度;

  • 在(b)从100K SIFT扩展到31M时,RKD-Trees能够更快地执行,然而如果你想要找到那些匹配的最佳精度,速度会稍微降低;

  • 在(c) RKD-Tree搜索中,对于查询没有真正匹配的数据集表现更好。

所以他们确实依赖于数据集。例如,您可以得出结论,RKD-Tree对较大的数据集执行得更快,但是如果精度是您尝试实现的任何任务的相关度量,则RKD-Trees性能将类似于K-means搜索。