当n_neighbors小于项目总数时,为什么NearestNeighbors(SKlearn)需要更多时间?

时间:2017-01-30 11:47:32

标签: python machine-learning scikit-learn similarity nearest-neighbor

我想为数据集中的每个 N 项计算前20个相似项。 每个项目都使用 M 维度的特征表示。因此,数据大小为 N_items X M_features

当我没有指定n_neighbors(默认值为5)时,kneighbors函数需要很多时间。 但是当我指定n_neighbors = N_items时,它几乎可以立即得出结果。

即。 NN_object = NearestNeighbors()需要花费大量时间才能找到kneighbors,但NN_object = NearestNeighbors(n_neighbors=N_items)会很快得出结果。

任何人都可以解释幕后发生的事情吗?

PS:N_items在我的情况下 ~50K M_features ~10K

0 个答案:

没有答案