Python中的大型最近邻图

时间:2017-06-05 15:00:54

标签: python machine-learning scikit-learn knn nearest-neighbor

我有一个400K vs 300矩阵。

我想用大约20个邻居创建一个最近邻图(矩阵)。

我尝试了什么?

我使用scikit学习最近邻居api,但是花了太长时间。半小时后才回应。

我必然会使用python,我该如何解决这个问题。欢迎任何解决方案。感谢。

1 个答案:

答案 0 :(得分:1)

你试试:

  • 减少数据
  • 使用approximate版本的NN算法
  • algorithm = 'kd_tree' scikit.learn的参数(对大量样本更好)
  • ...

有很多选择。阅读how to choose the best NN algorithm可能会很有趣。