K表示使用R的聚类分析结果

时间:2017-06-08 10:54:53

标签: r k-means

我尝试了对数据集进行k均值聚类分析。客户的数据集包括订单号(客户向公司下订单的时间;可以是任何数字),订单日(最近订单的星期几; 0到6)和忠诚客户的订单小时(最近订单的当天小时; 0到23)。我缩放了数值并使用了。

# K-Means Cluster Analysis
fit <- kmeans(mydata, 3) # 5 cluster solution
# get cluster means 
aggregate(mydata,by=list(fit$cluster),FUN=mean)

但是,我也得到一些负面价值观。在互联网上,他们说这意味着群体内的差异大于其他群体的差异。但是,我无法理解如何解释输出。 你能举一个如何解释的例子吗?

Group.1  order_number      order_dow order_hour_of_day
1       1 -0.4434400796  0.80263819338    -0.04766613741
2       2  1.6759259419  0.09051366962     0.07815242904
3       3 -0.3936748015 -1.00553744774     0.01377787416

0 个答案:

没有答案