我有一个数据集
customer | income(k) | spend (k)
value value value
数据集有40个条目。
我正在使用弯头方法来尝试找出要使用的群集数。
我的问题是如何确定set.seed()
使用哪个数字?
代码如下:
set.seed(?)
wcss = vector()
for (i in 1:10) wcss[i] = sum(kmeans(new_dataset, i)$withinss)
plot(1:10,
wcss,
type = 'b',
main = paste('The Elbow Method'),
xlab = 'Number of clusters',
ylab = 'WCSS')