为什么r不考虑kmeans聚类中的as.factor

时间:2017-11-06 20:44:08

标签: r

我的数据enter image description here

哪个月1是1月,依此类推,当我想要进行聚类时,R将这些数字视为数字,而不是频率如enter image description here

但我希望将它们聚集为monthes或名称

1 个答案:

答案 0 :(得分:0)

Kmeans试图找到k点,其中分配给它的每个点的距离被最小化。通常,欧氏距离用作距离测量,它仅适用于数字向量空间。

在这种情况下,因子被解释为数字。您需要使用其他距离指标,例如manhatten或gower distance。