Kmean算法和余弦距离

时间:2016-12-06 07:02:00

标签: cluster-analysis cosine-similarity

我使用了欧几里德距离的K均值算法聚类我的数据集,然后我尝试了余弦距离,但算法没有收敛余弦指标 (它没有停止 - 迭代达到1000)

请提出任何建议

1 个答案:

答案 0 :(得分:0)

余弦应该没问题,因为它相当于欧几里德对L2标准化数据的看法。除非你有编程错误,否则它应该收敛。

或者,您可以对数据进行标准化,然后使用常规的k-means代替球形k-means。

注意,如果您使用Mini-Batch,设计并不会收敛。如果您对批次进行抽样,则不能。

相关问题