如何使用欧氏距离计算点/簇之间的接近程度?

时间:2015-09-08 07:59:18

标签: cluster-analysis data-mining

考虑一个包含以下4个交易的市场篮子数据库 第1,2,3,4,5和6项。

(a) {1,2,3,5},

(b) {2,3,4,5},

(c) {1,4}和

(d) {6}。

交易可以被视为具有对应于项目1,2,3,4,5和6的布尔(0/1)属性的点。因此四个点成为

(1,1,1,0,1,0),
(0,1,1,1,1,0),
(1,0,0,1,0,0),
(0,0,0,0,0,1).

使用欧氏距离来测量点/簇之间的接近程度,我该如何计算

  • d(1,2)=?
  • d(1,3)=?
  • d(1,4)=?
  • d(2,3)=?
  • d(2,4)=?
  • d(3,4)=?

(他们说d(3,4)= sqrt(3),是吗?问题中是否缺少某些内容)

1 个答案:

答案 0 :(得分:1)

欧几里德距离在您的情况下定义为:

d(i, j) = sqrt( Sum_{k=1..6} (i_k - j_k)^2 )

其中i_k是第i个交易的第k个项目,Sum表示这些操作的总和。

所以你必须迭代这些项来计算这些值。