在1-d数据上使用什么聚类算法?

时间:2011-05-27 03:12:24

标签: python cluster-analysis

我有一个数组列表中的数字。每个元素的索引是X,值是Y.我如何分区/聚类这些数据? 如果我有一个数组,我只想要一组标记每个分区结束的值。由于我正在使用Python,请提及是否有相同的库。

感谢。

1 个答案:

答案 0 :(得分:5)

K-Means是一个非常简单的聚类算法,我会说第一个在进行更复杂的事情之前进行测试。 K-Means算法http://en.wikipedia.org/wiki/K-means_clustering

强烈建议正确的K-Means初始化http://en.wikipedia.org/wiki/K-means%2B%2B,因为它。

如果你对K-Means不满意,那么你使用EM算法和高斯混合(http://en.wikipedia.org/wiki/Mixture_model),不太难编码,你可以使用K-Means来初始化它!

这些已经在Python中实现了100次,检查任何机器学习工具箱。