应用错误收集

提高集群性能

时间：2014-03-12 17:05:30

标签： r cluster-analysis k-means

我正在使用kmodes对包含分类数据的数据集进行聚类，并且开始花费太长时间。我正在考虑两种方法： 1）减少迭代次数2）随机选择一个较小的数据子集，得到质心，然后根据最近的质心为其余的数据分配一个簇。

我想知道这两种方法之间的权衡取舍，或者是否有其他方法我不会考虑。

0 个答案:

没有答案