我想进行K-means分析,其中我的一些变量应该被认为比其他变量更重要。我找到了kmeansw函数,但在阅读它的帮助后我有点困惑:
用法
kmeansW(x,center,weight = rep(1,nrow(x)), iter.max = 10,nstart = 1)参数
x
数字向量,矩阵或数据框。
中心
群集数量或一组初始(不同)群集 中心。如果是数字,则选择x中随机的一组(不同的)行 作为最初的中心。
重量
x元素的权重。默认情况下相同。
iter.max
允许的最大迭代次数。
nstart
如果center是一个数字,应该选择多少个随机集?
我是否理解它权衡数据框(行)而不是变量(列)的元素?如果这是对的,你会推荐另外的方法来解决这个问题吗?
答案 0 :(得分:0)
您只需在缩放数据后将特征乘以所需的权重即可。这增加了观测值之间加权特征的欧式距离,因此可以满足您的要求。