K表示对数据进行聚类或排序

时间:2012-11-20 02:36:31

标签: database k-means

我有一个大型数据库,其中包含有关国家名称,位置,人类发展指数(HDI)和人口等国家的数据。我需要根据人口将这些数据分类到一些“K”组。我的一位朋友建议,在这种情况下,K-means clustring将是有用的。但我想,这可以通过根据人口排序数据直接完成,然后将这些排序数据分成组。这两种方法有什么区别吗?

由于

1 个答案:

答案 0 :(得分:1)

沿一个维度递归拆分会产生决策树。它是一种不同的数据结构。组之间的所有切口都沿轴(水平或垂直)。 K-means可以实现平衡,因为切割不一定是水平或垂直(大部分时间不是)。

实际上,决策树方法也非常有用。你可能会尝试一下。