我尝试了对数据集进行k均值聚类分析。客户的数据集包括订单号(客户向公司下订单的时间;可以是任何数字),订单日(最近订单的星期几; 0到6)和忠诚客户的订单小时(最近订单的当天小时; 0到23)。我缩放了数值并使用了。
# K-Means Cluster Analysis
fit <- kmeans(mydata, 3) # 5 cluster solution
# get cluster means
aggregate(mydata,by=list(fit$cluster),FUN=mean)
但是,我也得到一些负面价值观。在互联网上,他们说这意味着群体内的差异大于其他群体的差异。但是,我无法理解如何解释输出。 你能举一个如何解释的例子吗?
Group.1 order_number order_dow order_hour_of_day
1 1 -0.4434400796 0.80263819338 -0.04766613741
2 2 1.6759259419 0.09051366962 0.07815242904
3 3 -0.3936748015 -1.00553744774 0.01377787416