我在理解什么似乎很容易计算方面遇到了一些麻烦。
我理解Jaccard系数是交叉(A,B)/联合(A,B),那怎么会这样呢?
> sets::gset_similarity(c("1","2"), c("1","2","3"), "Jaccard")
[1] 1
不是2/3
吗?
答案 0 :(得分:4)
如果您传递实际的set
数据(请参阅?sets::set
)
gset_similarity(set("1","2"), set("1","2","3"), "Jaccard")
#[1] 0.6666667
或
gset_similarity(as.set(c("1","2")), as.set(c("1","2","3")), "Jaccard")
#[1] 0.6666667
...如果您有现有的向量并需要转换它们。