在2500万个向量中查找向量的距离

时间:2017-05-25 11:41:23

标签: c++ linux vector distance nearest-neighbor

我有2500万个高维矢量(例​​如2000维), 什么是一个有效的系统,我可以在那里索引这些向量, 然后传入一个新的向量并返回K个最近的向量?

我将在Linux系统上运行它。

1 个答案:

答案 0 :(得分:0)

您可以相对于n维轴制作n维角度的索引。这将花费 O(n)时间,然后您可以在 O(nlogn)时间的min中对您的首选排序进行排序。我想那时搜索将在 O(logn)时间内取出k向量 + x (完成的工作量)。我不认为这种问题存在捷径。