我希望使用kmeans算法来聚类一些数据,但我想使用自定义距离函数。有什么方法可以改变scikit-learn使用的距离函数吗?
我还会选择一个不同的框架/模块,允许交换距离函数并且可以并行计算kmeans(我想加快计算速度,这是scikit-learn的一个很好的特性)
有什么建议吗?
答案 0 :(得分:1)
您可以尝试光谱聚类算法,它允许您输入自己的距离矩阵(根据需要计算)。
它的性能对于凸边界上的K-means没有任何羡慕,但也可以解决非凸问题(检测连通性)。查看更多here。
好消息是谱聚类为also implemented in scikit-learn。
希望它有所帮助。