我有一个数组列表中的数字。每个元素的索引是X,值是Y.我如何分区/聚类这些数据? 如果我有一个数组,我只想要一组标记每个分区结束的值。由于我正在使用Python,请提及是否有相同的库。
感谢。
答案 0 :(得分:5)
K-Means是一个非常简单的聚类算法,我会说第一个在进行更复杂的事情之前进行测试。 K-Means算法http://en.wikipedia.org/wiki/K-means_clustering
强烈建议正确的K-Means初始化http://en.wikipedia.org/wiki/K-means%2B%2B,因为它。
如果你对K-Means不满意,那么你使用EM算法和高斯混合(http://en.wikipedia.org/wiki/Mixture_model),不太难编码,你可以使用K-Means来初始化它!
这些已经在Python中实现了100次,检查任何机器学习工具箱。