最佳地聚类一维数据?

时间:2011-10-23 22:12:50

标签: r cluster-analysis k-means cran

有没有人有一篇论文解释Ckmeans.1d.dp算法的工作原理?

或者:在一维中进行k均值聚类的最佳方法是什么?

1 个答案:

答案 0 :(得分:2)

基于Monge矩阵的理论结果,单变量k均值聚类可以在O(kn)时间(已经排序的输入)上求解,但该方法最不可能是由于数值不稳定以及编码挑战。 / p>

更好的选择是O(knlgn)方法,现在在Ckmeans.1d.dp版本3.4.6中实现。这种实现与启发式k均值一样快,但提供了保证的最优性,比启发式k均值更好,特别是对于大型k.

Richard Bellman(1973)的通用动态规划解决方案没有触及k-means问题的细节,隐含的运行时间是O(kn ^ 3)。