有没有人有一篇论文解释Ckmeans.1d.dp算法的工作原理?
或者:在一维中进行k均值聚类的最佳方法是什么?
答案 0 :(得分:2)
基于Monge矩阵的理论结果,单变量k均值聚类可以在O(kn)时间(已经排序的输入)上求解,但该方法最不可能是由于数值不稳定以及编码挑战。 / p>
更好的选择是O(knlgn)方法,现在在Ckmeans.1d.dp版本3.4.6中实现。这种实现与启发式k均值一样快,但提供了保证的最优性,比启发式k均值更好,特别是对于大型k.
Richard Bellman(1973)的通用动态规划解决方案没有触及k-means问题的细节,隐含的运行时间是O(kn ^ 3)。