雅克卡距离

时间:2010-12-07 15:57:15

标签: algorithm distance

我在计算集合(位矢量)的Jaccard距离时遇到此问题:

p1 = 10111;

p2 = 10011。

交叉点大小= 3; (我们怎么能找到它?)

联合的大小= 4,(我们怎么能找到它?)

Jaccard相似度=(交集/联合)= 3/4。

Jaccard距离= 1 - (Jaccard相似度)=(1-3 / 4)= 1/4。

但我不明白我们怎样才能找到两个载体的“交叉点”“union”

请帮帮我。

非常感谢。

2 个答案:

答案 0 :(得分:6)

  

交叉点大小= 3; (我们怎么能找到它?)

p1&p2 = 10011

的设定位数
  

联合的大小= 4,(我们怎么能找到它?)

p1|p2 = 10111

的设定位数

此处的向量表示二进制数组,其中第i位表示此集合中存在的第i个元素。

答案 1 :(得分:2)

如果p1 = 10111且p2 = 10011,

p1和p2的每个组合属性的总数:

  • M11 = p1&的属性总数。 p2的值为1,
  • M01 = p1的值为0&的属性总数。 p2的值为1,
  • M10 = p1值为1&的属性总数。 p2的值为0,
  • M00 = p1&的属性总数。 p2的值为0.

Jaccard相似系数= J =交点/联合= M11 /(M01 + M10 + M11)= 3 /(0 + 1 + 3)= 3/4,

Jaccard距离= J' = 1 - J = 1 - 3/4 = 1/4, 或J' = 1 - (M11 /(M01 + M10 + M11))=(M01 + M10)/(M01 + M10 + M11)=(0 + 1)/(0 + 1 + 3)= 1/4