我有一个大型数据库,其中包含有关国家名称,位置,人类发展指数(HDI)和人口等国家的数据。我需要根据人口将这些数据分类到一些“K”组。我的一位朋友建议,在这种情况下,K-means clustring将是有用的。但我想,这可以通过根据人口排序数据直接完成,然后将这些排序数据分成组。这两种方法有什么区别吗?
由于
答案 0 :(得分:1)
沿一个维度递归拆分会产生决策树。它是一种不同的数据结构。组之间的所有切口都沿轴(水平或垂直)。 K-means可以实现平衡,因为切割不一定是水平或垂直(大部分时间不是)。
实际上,决策树方法也非常有用。你可能会尝试一下。