命令dist(x,method =“binary”)如何计算距离矩阵?

时间:2014-05-15 18:28:41

标签: r distance

我一直试图解决这个问题,但没有取得多大成功。我正在使用具有二进制数据(0和1)的表。我设法使用 R 函数dist(x,method="binary")从我的数据估计距离矩阵,但我不太确定这个函数究竟是如何估计距离矩阵的。是否使用Jaccard系数J =(M11)/(M10 + M01 + M11)?

1 个答案:

答案 0 :(得分:4)

这可以在帮助页?dist中找到:

  

此函数计算并返回通过使用指定的距离度量计算的距离矩阵,以计算数据矩阵行之间的距离。

     

[...]

     

二进制:(又名非对称二进制):向量被视为二进制   比特,所以非零元素是'开',零元素'关'。该   距离是其中只有一个位的比特的比例   那些至少有一个人在上的人。

这相当于Jaccard distance as described in Wikipedia

  

Jaccard距离的另一种解释是对称差异与联合的大小之比。

在你的符号中,它是1 - J =(M01 + M10)/(M01 + M10 + M11)。