R k-意味着产生“计算奇异”误差

时间:2016-02-03 17:19:26

标签: r cluster-analysis k-means

我有一个包含29个观察值和15个变量的数据集。我正在尝试执行k-means聚类分析,当我尝试使用NbClust包确定集群数时,我收到以下错误:

> library(NbClust)
> set.seed(1234)
> nc <- NbClust(df, min.nc=2, max.nc=15, method="kmeans")
Error in solve.default(W) : 
  system is computationally singular: reciprocal condition number = 1.50527e-17
In addition: Warning messages:
1: In pf(beale, pp, df2) : NaNs produced
2: In pf(beale, pp, df2) : NaNs produced

如果我删除一个将我的观察值增加到41的变量(即数据帧现在是41 x 14),NbClust确实有效。

有人可以帮助我理解为什么我会在29 x 15数据帧中获得计算奇异错误吗?

此外,即使使用41 x 14数据帧,我也看不到wss情节中的明显弯曲:

wss plot

NbClust建议15个集群。这是否意味着我没有明确的集群?

1 个答案:

答案 0 :(得分:0)

WSS情节表明根本不起作用

这样的图表表明可能只有 1 群集。

可能是由于预处理不充分,或者因为算法对于此数据而言是错误的选择。无论哪种方式,我都认为结果不起作用。