Question

我尝试了对数据集进行k均值聚类分析。客户的数据集包括订单号（客户向公司下订单的时间;可以是任何数字），订单日（最近订单的星期几; 0到6）和忠诚客户的订单小时（最近订单的当天小时; 0到23）。我缩放了数值并使用了。

# K-Means Cluster Analysis
fit <- kmeans(mydata, 3) # 5 cluster solution
# get cluster means 
aggregate(mydata,by=list(fit$cluster),FUN=mean)

但是，我也得到一些负面价值观。在互联网上，他们说这意味着群体内的差异大于其他群体的差异。但是，我无法理解如何解释输出。你能举一个如何解释的例子吗？

Group.1  order_number      order_dow order_hour_of_day
1       1 -0.4434400796  0.80263819338    -0.04766613741
2       2  1.6759259419  0.09051366962     0.07815242904
3       3 -0.3936748015 -1.00553744774     0.01377787416

K表示使用R的聚类分析结果

0 个答案: