我在excel表中有一个数据集,我需要通过赋值来对它进行聚类。我该怎么做?
答案 0 :(得分:1)
您可以定义一个函数,该函数根据属性权重计算两点之间的距离。这方面的一个例子是加权欧几里德距离
具体来说,如果数据集中的每个点都有k个属性,并且属性的相应权重是d1,d2,..,dk,那么两个点X和Y之间的距离是
d(X,Y)= sum(di *(Xi-Yi)^ 2)i = 1,2..k其中Xi是点X的ith属性值。
如果权重与属性的方差相反,则减少到马哈拉诺比斯距离
http://en.wikipedia.org/wiki/Mahalanobis_distance
定义距离函数后,您可以使用K-means来聚类数据。