我有一个包含29个观察值和15个变量的数据集。我正在尝试执行k-means聚类分析,当我尝试使用NbClust包确定集群数时,我收到以下错误:
> library(NbClust)
> set.seed(1234)
> nc <- NbClust(df, min.nc=2, max.nc=15, method="kmeans")
Error in solve.default(W) :
system is computationally singular: reciprocal condition number = 1.50527e-17
In addition: Warning messages:
1: In pf(beale, pp, df2) : NaNs produced
2: In pf(beale, pp, df2) : NaNs produced
如果我删除一个将我的观察值增加到41的变量(即数据帧现在是41 x 14),NbClust确实有效。
有人可以帮助我理解为什么我会在29 x 15数据帧中获得计算奇异错误吗?
此外,即使使用41 x 14数据帧,我也看不到wss情节中的明显弯曲:
NbClust建议15个集群。这是否意味着我没有明确的集群?
答案 0 :(得分:0)
WSS情节表明根本不起作用。
这样的图表表明可能只有 1 群集。
可能是由于预处理不充分,或者因为算法对于此数据而言是错误的选择。无论哪种方式,我都认为结果不起作用。