R中的Kmeans:比不同的数据点更多的聚类中心

时间:2017-12-20 10:05:05

标签: r cluster-analysis k-means

在R中使用kmeans会导致以下问题:

  

kmeans出错(smpl $ LOAN_AMOUNT,centers = 10):   比不同的数据点更多的集群中心。

我提供了一个主要数据集的示例,其中包含带有摘要的因子属性:

摘要(MYDATA)

100 101 102 131 132 200 201 202 250 251 252 253 254 255 305 424 436 502 550 701 702 705 800 950 
 1 989   1   4   4  18 382  31 412  74   7  15   4   1   1   1   1   4  12   1   3   1  25   5 

对于我想要对其样本进行聚类的每个因素,我知道当每个因子中的样本数量不够大,导致一些空簇时,程序失败,

这是我的问题: 无论如何要集群数据,群集的数量最多为K?

谢谢

1 个答案:

答案 0 :(得分:0)

K-means仅适用于连续变量。

它需要计算 mean ,而不是为因子定义。

因此,如果忽略这些因素,则所有向量都是相同的。