考虑一个包含以下4个交易的市场篮子数据库 第1,2,3,4,5和6项。
(a) {1,2,3,5},
(b) {2,3,4,5},
(c) {1,4}和
(d) {6}。
交易可以被视为具有对应于项目1,2,3,4,5和6的布尔(0/1)属性的点。因此四个点成为
(1,1,1,0,1,0),
(0,1,1,1,1,0),
(1,0,0,1,0,0),
(0,0,0,0,0,1).
使用欧氏距离来测量点/簇之间的接近程度,我该如何计算
(他们说d(3,4)= sqrt(3),是吗?问题中是否缺少某些内容)
答案 0 :(得分:1)
欧几里德距离在您的情况下定义为:
d(i, j) = sqrt( Sum_{k=1..6} (i_k - j_k)^2 )
其中i_k
是第i个交易的第k个项目,Sum
表示这些操作的总和。
所以你必须迭代这些项来计算这些值。