标签: r cluster-analysis k-means
我正在使用kmodes对包含分类数据的数据集进行聚类,并且开始花费太长时间。我正在考虑两种方法: 1)减少迭代次数2)随机选择一个较小的数据子集,得到质心,然后根据最近的质心为其余的数据分配一个簇。
我想知道这两种方法之间的权衡取舍,或者是否有其他方法我不会考虑。