我在计算集合(位矢量)的Jaccard距离时遇到此问题:
p1 = 10111;
p2 = 10011。
交叉点大小= 3; (我们怎么能找到它?)
联合的大小= 4,(我们怎么能找到它?)
Jaccard相似度=(交集/联合)= 3/4。
Jaccard距离= 1 - (Jaccard相似度)=(1-3 / 4)= 1/4。
但我不明白我们怎样才能找到两个载体的“交叉点”和“union”。
请帮帮我。
非常感谢。
答案 0 :(得分:6)
交叉点大小= 3; (我们怎么能找到它?)
p1&p2 = 10011
联合的大小= 4,(我们怎么能找到它?)
p1|p2 = 10111
此处的向量表示二进制数组,其中第i位表示此集合中存在的第i个元素。
答案 1 :(得分:2)
如果p1 = 10111且p2 = 10011,
p1和p2的每个组合属性的总数:
Jaccard相似系数= J =交点/联合= M11 /(M01 + M10 + M11)= 3 /(0 + 1 + 3)= 3/4,
Jaccard距离= J' = 1 - J = 1 - 3/4 = 1/4, 或J' = 1 - (M11 /(M01 + M10 + M11))=(M01 + M10)/(M01 + M10 + M11)=(0 + 1)/(0 + 1 + 3)= 1/4