肯德尔的距离和肯德尔的牛头距离有什么区别?

时间:2019-02-09 04:06:43

标签: algorithm aggregate distance aggregation ranking

我现在正尝试使用Kendall的距离来改进基于Borda计数方法的排名集。

要求我遵循特定文档的说明。在文件中指出:

“肯德尔的距离将两个排名中的项目之间的成对分歧计算为: enter image description here

其中

enter image description here 肯德尔的距离通过其最大值C2n归一化。肯德尔的距离越短,排名之间的相似度就越高。

Kendall的tau是另一种衡量等级之间相似度的方法,很容易与Kendall的距离混淆。 肯德尔的tau定义为: enter image description here

根据标准化的肯德尔距离定义肯德尔的tau。请注意,肯德尔的tau越大,所比较排名之间的相似度就越大。在本文中,我们使用肯德尔的距离而不是肯德尔的tau。”

我的目标是通过使用肯德尔的距离来提高以下排名:

    x1 x2 x3 x4
A1  4  1  3  2
A2  4  1  3  2
A3  4  3  2  1
A4  1  4  3  2
A5  1  2  4  3

在该排名中,第 i 行表示基于A i 获得的排名,每列表示相应项在每个排名中的排名位置。 (即x n 代表要排名的项目,A i 代表对项目进行排名的项目。)

尽管文档有解释,但我不明白两个距离之间有什么区别。 sigma符号下面的“(j,s),j!= s”代表什么?最后如何在上面提供的排名中实现肯德尔的距离?

1 个答案:

答案 0 :(得分:0)

距离和相似性是两个相关的概念,但是对于距离,精确的身份表示距离0,并且随着事物之间的差异越来越大,它们之间的距离也变得更大,没有非常明显的固定极限。行为良好的距离将服从度量标准-请参阅https://en.wikipedia.org/wiki/Metric_(mathematics)。对于相似性,确切的身份表示相似性1,随着事物变大,相似性会降低,但通常不会降低到0以下。Kendall的tau似乎是将Kendall的距离变成相似性的一种方式。

“(j,s),j!= s”表示考虑j和s的所有可能性,但j = s的可能性除外。

您可以通过简单地将j不等于s的所有可能性相加来计算肯德尔的距离-但这花费的时间与项数的平方成正比。在某些情况下,花费的时间只会增加n * log(n),其中n是项的数量-有关此内容以及Kendall上的许多其他内容,请参见https://en.wikipedia.org/wiki/Kendall_rank_correlation_coefficient