scikit-learn kmeans自定义距离

时间:2015-06-29 23:22:42

标签: python scikit-learn

我希望使用kmeans算法来聚类一些数据,但我想使用自定义距离函数。有什么方法可以改变scikit-learn使用的距离函数吗?

我还会选择一个不同的框架/模块,允许交换距离函数并且可以并行计算kmeans(我想加快计算速度,这是scikit-learn的一个很好的特性)

有什么建议吗?

1 个答案:

答案 0 :(得分:1)

您可以尝试光谱聚类算法,它允许您输入自己的距离矩阵(根据需要计算)。

它的性能对于凸边界上的K-means没有任何羡慕,但也可以解决非凸问题(检测连通性)。查看更多here

好消息是谱聚类为also implemented in scikit-learn

希望它有所帮助。