我一直试图解决这个问题,但没有取得多大成功。我正在使用具有二进制数据(0和1)的表。我设法使用 R 函数dist(x,method="binary")
从我的数据估计距离矩阵,但我不太确定这个函数究竟是如何估计距离矩阵的。是否使用Jaccard系数J =(M11)/(M10 + M01 + M11)?
答案 0 :(得分:4)
这可以在帮助页?dist
中找到:
此函数计算并返回通过使用指定的距离度量计算的距离矩阵,以计算数据矩阵行之间的距离。
[...]
二进制:(又名非对称二进制):向量被视为二进制 比特,所以非零元素是'开',零元素'关'。该 距离是其中只有一个位的比特的比例 那些至少有一个人在上的人。
这相当于Jaccard distance as described in Wikipedia:
Jaccard距离的另一种解释是对称差异与联合的大小之比。
在你的符号中,它是1 - J =(M01 + M10)/(M01 + M10 + M11)。