通过为属性分配权重来进行聚类

时间:2011-11-23 18:29:42

标签: excel data-mining

我在excel表中有一个数据集,我需要通过赋值来对它进行聚类。我该怎么做?

1 个答案:

答案 0 :(得分:1)

您可以定义一个函数,该函数根据属性权重计算两点之间的距离。这方面的一个例子是加权欧几里德距离

具体来说,如果数据集中的每个点都有k个属性,并且属性的相应权重是d1,d2,..,dk,那么两个点X和Y之间的距离是

d(X,Y)= sum(di *(Xi-Yi)^ 2)i = 1,2..k其中Xi是点X的ith属性值。

如果权重与属性的方差相反,则减少到马哈拉诺比斯距离

http://en.wikipedia.org/wiki/Mahalanobis_distance

定义距离函数后,您可以使用K-means来聚类数据。