标签: algorithm mahout k-means
如何使用mahout计算k-means聚类中的成本函数值?
我正在接受Coursera的机器学习课程。并且有人建议,如果我们在 k-means 聚类期间进行簇的随机初始化,为了计算聚类,我们应该使用不同的初始聚类质心值多次执行它。然后我们应该检查成本函数的值,以查看所产生的迭代成本是否最小。
你能否建议如何计算Apache mahout实现k-means聚类的成本价值?
答案 0 :(得分:5)
它是独立于实现的。只需计算从点到各自质心的平方距离之和。这是您的成本函数。