带有加权变量的K均值

时间:2017-09-14 14:24:25

标签: r statistics k-means

我想进行K-means分析,其中我的一些变量应该被认为比其他变量更重要。我找到了kmeansw函数,但在阅读它的帮助后我有点困惑:

  

用法

     

kmeansW(x,center,weight = rep(1,nrow(x)),           iter.max = 10,nstart = 1)参数

     

x

     

数字向量,矩阵或数据框。

     

中心

     

群集数量或一组初始(不同)群集   中心。如果是数字,则选择x中随机的一组(不同的)行   作为最初的中心。

     

重量

     

x元素的权重。默认情况下相同。

     

iter.max

     

允许的最大迭代次数。

     

nstart

     

如果center是一个数字,应该选择多少个随机集?

我是否理解它权衡数据框(行)而不是变量(列)的元素?如果这是对的,你会推荐另外的方法来解决这个问题吗?

1 个答案:

答案 0 :(得分:0)

您只需在缩放数据后将特征乘以所需的权重即可。这增加了观测值之间加权特征的欧式距离,因此可以满足您的要求。