performance - k-means算法会改善数据处理的性能吗？

k-means算法会改善数据处理的性能吗？

时间：2015-10-23 04:18:33

标签： performance dataset k-means

我试图将k-means算法应用于大型数据集，因为k-means的目标是将一组数据点划分为k个簇。我不确定我是否会通过k-means集群重新划分数据集，是否能够提高数据处理的性能？

1 个答案:

答案 0 :(得分：0)

答案是肯定的。试试这个，

将原始数据集划分为块;每个块单元，称为单元块（UB），包含至少一个模式。我们可以通过简单的计算找到单位块（CUB）的质心。所有计算的CUB形成表示原始数据集的简化数据集。然后使用简化的数据集来计算原始数据集的最终质心。我们只需要检查候选簇边界上的每个UB，找到UB中每个模式最接近的最终质心。通过这种方式，我们可以大大减少计算最终收敛质心的时间。

我们应该使用k-means ++而不是k-means吗？
k表示聚类样本数据
K-means ++算法
K表示在矩阵上而不是数据上进行聚类
什么是K-Means ++的流程，我想知道K-Mean和K-Means ++之间的确切差异？
我如何知道算法（例如k-means）运行多长时间？
'标准'k-means聚类和快速k均值之间有什么区别？
k-means算法会改善数据处理的性能吗？
K-Means聚类分区
K-means算法C＃

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？