R的Jaccard系数

时间:2016-06-13 01:13:07

标签: r similarity

我在理解什么似乎很容易计算方面遇到了一些麻烦。

我理解Jaccard系数是交叉(A,B)/联合(A,B),那怎么会这样呢?

> sets::gset_similarity(c("1","2"), c("1","2","3"), "Jaccard")
[1] 1

不是2/3吗?

1 个答案:

答案 0 :(得分:4)

如果您传递实际的set数据(请参阅?sets::set

,它就有效
gset_similarity(set("1","2"), set("1","2","3"), "Jaccard") 
#[1] 0.6666667

gset_similarity(as.set(c("1","2")), as.set(c("1","2","3")), "Jaccard")
#[1] 0.6666667

...如果您有现有的向量并需要转换它们。