在R中使用kmeans会导致以下问题:
kmeans出错(smpl $ LOAN_AMOUNT,centers = 10): 比不同的数据点更多的集群中心。
我提供了一个主要数据集的示例,其中包含带有摘要的因子属性:
摘要(MYDATA)
100 101 102 131 132 200 201 202 250 251 252 253 254 255 305 424 436 502 550 701 702 705 800 950
1 989 1 4 4 18 382 31 412 74 7 15 4 1 1 1 1 4 12 1 3 1 25 5
对于我想要对其样本进行聚类的每个因素,我知道当每个因子中的样本数量不够大,导致一些空簇时,程序失败,
这是我的问题: 无论如何要集群数据,群集的数量最多为K?
谢谢
答案 0 :(得分:0)
K-means仅适用于连续变量。
它需要计算 mean ,而不是为因子定义。
因此,如果忽略这些因素,则所有向量都是相同的。