在scipy中使用pdist进行Jaccard距离计算

时间:2016-02-20 13:42:03

标签: python numpy scipy

import scipy.spatial.distance as dist

Y=[[1,2,3],[2,3,4]]

Q=dist.pdist(Y,'jaccard')

print Q

以下代码段将jaccard距离设为1,而{j}应为0.5。 另一方面,如果Y=[[1,2,3],[4,2,3]],即如果更改排序,则输出为0.33。但是,jaccard距离与元素的顺序无关。你能在这里建议如何解决这个问题吗?

1 个答案:

答案 0 :(得分:1)

jaccard function的文档字符串比pdist docstring中的简洁摘要更好地描述了计算。 jaccard计算布尔数组的Jaccard-Needham相似度。其他数组类型的行为未定义,因此您不应该传递任意整数的数组。